arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 35 72小时内新更新论文 72h更新 112 最新: DAIT: Distillation from Vision-Language Models to Lightweight Classifiers with Adaptive Intermediate Teacher Transfer 03-23

arXiv ID: 2603.02041

arXiv 提交日期: 2026-03-02

llm model training natural language processing multilingual llms continued pretraining low-resource languages estonian instruction tuning

EstLLM：通过持续预训练与后训练增强多语言大语言模型的爱沙尼亚语能力 / EstLLM: Enhancing Estonian Capabilities in Multilingual LLMs via Continued Pretraining and Post-Training

1️⃣ 一句话总结

这项研究通过为多语言大模型‘加练’爱沙尼亚语数据，并巧妙平衡其他语言和技能的训练，成功大幅提升了模型对这门小语种的理解和生成能力，同时保持了原有的英语和通用推理水平。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02146

arXiv 提交日期: 2026-03-02

llm reinforcement learning model training long-context reasoning verifiable rewards context grounding sparse reward problem rlvr

LongRLVR：长上下文强化学习需要可验证的上下文奖励 / LongRLVR: Long-Context Reinforcement Learning Requires Verifiable Context Rewards

1️⃣ 一句话总结

这篇论文提出了一种名为LongRLVR的新方法，通过为大型语言模型在长文本任务中增加一个可验证的上下文奖励信号，有效解决了传统方法因奖励信号稀疏而难以学习从外部信息中寻找证据的问题，从而显著提升了模型在长上下文推理任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02066

arXiv 提交日期: 2026-03-02

machine learning model training systems reinforcement learning partial differential equations mesh optimization surrogate models spatial adaptivity

通过强化学习引导的网格优化加速偏微分方程代理模型训练 / Accelerating PDE Surrogates via RL-Guided Mesh Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为RLMesh的新方法，它利用强化学习智能地为偏微分方程模拟动态分配计算资源，将网格点集中在最关键的求解区域，从而在保证精度的前提下，大幅减少了训练深度学习代理模型所需的高成本模拟次数。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02331

arXiv 提交日期: 2026-03-02

machine learning model training model evaluation demand estimation neural networks habit formation welfare analysis consumer behavior

基于习惯形成与理性约束的神经需求估计 / Neural Demand Estimation with Habit Formation and Rationality Constraints

1️⃣ 一句话总结

这篇论文开发了一种新的需求预测模型，它利用神经网络来模拟消费者在预算分配中如何受过去消费习惯的影响，并通过引入理性经济约束，使得模型在预测商品需求变化和评估价格政策带来的福利影响时，比传统静态模型更准确、更符合现实。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01448

arXiv 提交日期: 2026-03-02

machine learning data model training deep learning similarity search time series neural networks data summarization

SEAnet：一种用于数据序列相似性搜索的深度学习架构 / SEAnet: A Deep Learning Architecture for Data Series Similarity Search

1️⃣ 一句话总结

这篇论文提出了一种名为SEAnet的新型深度学习架构，它通过深度嵌入近似技术来生成高质量的数据序列摘要，从而在多种复杂数据集上显著提升了相似性搜索的准确性和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01420

arXiv 提交日期: 2026-03-02

machine learning systems model training neural operators physics-informed learning multiphysics simulation finite element method partial differential equations

通过有限元引导的物理信息算子学习解决多物理场问题 / Tackling multiphysics problems via finite element-guided physics-informed operator learning

1️⃣ 一句话总结

这篇论文提出了一种结合有限元方法和物理信息学习的框架，用于高效求解复杂多物理场耦合问题，无需依赖大量仿真数据，就能在不同几何形状和分辨率下进行准确预测。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01784

arXiv 提交日期: 2026-03-02

multi-modal model training model evaluation adversarial alignment co-evolutionary learning multimodal safety jailbreak robustness genetic algorithms

通过结构化对抗进化实现协同进化的多模态对齐 / Co-Evolutionary Multi-Modal Alignment via Structured Adversarial Evolution

1️⃣ 一句话总结

这篇论文提出了一个名为CEMMA的自动化自适应框架，通过让攻击者（不断进化生成更难破解的恶意提示）和防御者（持续学习这些新攻击来增强模型安全性）相互对抗、共同进化，从而更有效地提升多模态AI模型与人类价值观对齐的鲁棒性和泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01731

arXiv 提交日期: 2026-03-02

machine learning model training theory physics-informed neural networks inverse problems partial differential equations parameter estimation numerical methods

利用最小化方法与人工智能求解偏微分方程反问题 / Solving Inverse PDE Problems using Minimization Methods and AI

1️⃣ 一句话总结

这篇论文对比了传统数值方法与基于物理信息的神经网络（PINNs），发现PINNs能以有竞争力的计算成本有效求解复杂系统的正问题和反问题，为参数估计提供了新工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02012

arXiv 提交日期: 2026-03-02

medical computer vision model training medical imaging diffusion models pet denoising 3d reconstruction low-dose imaging

MAP-Diff：用于渐进式3D全身低剂量PET去噪的多锚点引导扩散模型 / MAP-Diff: Multi-Anchor Guided Diffusion for Progressive 3D Whole-Body Low-Dose PET Denoising

1️⃣ 一句话总结

这篇论文提出了一种名为MAP-Diff的新方法，它利用临床中实际采集的中等剂量PET扫描图像作为“锚点”来引导扩散模型，从而在降低辐射剂量的同时，能更稳定、更准确地从低质量图像中逐步重建出高质量的全身PET三维图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01385

arXiv 提交日期: 2026-03-02

llm multi-modal model training graph-tokenizing instruction tuning graph-text alignment reconstructive learning graph foundation model

迈向基于重构式图指令微调的图-标记化大语言模型 / Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning

1️⃣ 一句话总结

这篇论文提出了一种名为RGLM的新方法，通过让大语言模型在理解图数据后尝试重建图信息，从而更有效地将复杂的图结构与文本对齐，解决了现有方法过度依赖文本而忽略图本身信息的偏差问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.02041

1️⃣ 一句话总结

arXiv ID: 2603.02146

1️⃣ 一句话总结

arXiv ID: 2603.02066

1️⃣ 一句话总结

arXiv ID: 2603.02331

1️⃣ 一句话总结

arXiv ID: 2603.01448

1️⃣ 一句话总结

arXiv ID: 2603.01420

1️⃣ 一句话总结

arXiv ID: 2603.01784

1️⃣ 一句话总结

arXiv ID: 2603.01731

1️⃣ 一句话总结

arXiv ID: 2603.02012

1️⃣ 一句话总结

arXiv ID: 2603.01385

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.02041 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02146 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02066 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02331 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01448 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01420 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01784 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01731 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02012 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01385 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.02041

arXiv ID: 2603.02146

arXiv ID: 2603.02066

arXiv ID: 2603.02331

arXiv ID: 2603.01448

arXiv ID: 2603.01420

arXiv ID: 2603.01784

arXiv ID: 2603.01731

arXiv ID: 2603.02012

arXiv ID: 2603.01385