arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 88 72小时内新更新论文 72h更新 188 最新: Learning to Recall with Transformers Beyond Orthogonal Embeddings 03-21

arXiv ID: 2603.17484

arXiv 提交日期: 2026-03-18

llm model training systems attention mechanism long-context efficient training kv cache conditional computation

学习何时关注：长上下文大语言模型的条件化记忆访问机制 / Learning When to Attend: Conditional Memory Access for Long-Context LLMs

1️⃣ 一句话总结

这篇论文提出了一种名为L2A的新方法，它让大语言模型能够智能地判断何时需要对长文本进行全局关注，从而在显著降低计算成本的同时，将模型的有效上下文长度从3.2万扩展到12.8万词元，并提升了推理效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16062

arXiv 提交日期: 2026-03-17

machine learning model training model evaluation distributionally robust optimization feature selection covariate shift safe screening sparse sensing

协变量偏移下的安全分布鲁棒特征选择 / Safe Distributionally Robust Feature Selection under Covariate Shift

1️⃣ 一句话总结

本文提出了一种名为safe-DRFS的新方法，用于在模型部署环境可能与开发环境不同的情况下，安全地选择出能保证在所有可能环境中都表现良好的传感器（特征）子集，避免因环境变化导致关键传感器缺失。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16987

arXiv 提交日期: 2026-03-17

multi-modal model training systems vision-language models inference efficiency latency optimization compact models model serving

高效紧凑视觉语言模型的实用优化方案 / Empirical Recipes for Efficient and Compact Vision-Language Models

1️⃣ 一句话总结

这篇论文通过系统分析发现，小型视觉语言模型的实际推理速度远低于预期，并据此提出了一套实用的优化方案，能显著降低模型响应延迟而不损失精度，同时展示了如何为这类紧凑模型扩展结构化视觉感知能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16870

arXiv 提交日期: 2026-03-17

video generation model training theory diffusion models reasoning mechanisms chain-of-steps emergent behavior video understanding

揭秘视频推理：探索扩散模型中的推理机制 / Demystifing Video Reasoning

1️⃣ 一句话总结

这篇论文通过研究发现，视频生成模型的核心推理能力并非如先前认为的那样在视频帧之间顺序展开，而是在扩散去噪的步骤中逐步形成，并揭示了模型在这一过程中展现出的多种智能行为，为利用视频模型进行更复杂的推理任务提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.17024

arXiv 提交日期: 2026-03-17

multi-modal model training vision-language models chain-of-thought data synthesis reasoning reinforcement learning benchmark

HopChain：用于提升视觉语言推理泛化能力的多跳数据合成框架 / HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为HopChain的框架，通过自动合成需要多步逻辑推理的视觉语言数据来训练模型，有效提升了视觉语言模型在复杂、长链条推理任务上的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16840

arXiv 提交日期: 2026-03-17

computer vision model training model evaluation vision transformers positional encoding positional bias dino alibi

DINO看到了什么：ALiBi位置编码减少视觉Transformer中的位置偏差 / What DINO saw: ALiBi positional encoding reduces positional bias in Vision Transformers

1️⃣ 一句话总结

这篇论文发现像DINOv2这样的视觉Transformer模型在处理图像时，会因为位置编码而产生与内容无关的位置偏差，尤其是在材料科学等领域的均匀结构图像中影响零样本适应能力；作者通过微调模型采用ALiBi相对位置编码，有效减少了这种偏差，同时保持了模型良好的语义特征，使其能更好地用于复杂显微镜图像的分割任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16812

arXiv 提交日期: 2026-03-17

systems model training computer vision cpu-gpu integration chiplet architecture pre-silicon validation replay-driven simulation hardware emulation

基于ODIN的CPU-GPU架构：采用回放驱动的仿真与模拟验证方法 / ODIN-Based CPU-GPU Architecture with Replay-Driven Simulation and Emulation

1️⃣ 一句话总结

这篇论文提出了一种创新的“回放驱动”验证方法，通过录制并重放系统运行时的确定性波形，在仿真和模拟环境中快速复现复杂的CPU-GPU交互场景，从而大幅缩短了基于芯粒（Chiplet）架构的先进芯片的集成验证周期。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16184

arXiv 提交日期: 2026-03-17

audio natural language processing model training automatic speech recognition multilingual fine-tuning efficiency low-resource

Polyglot-Lion：通过平衡微调Qwen3-ASR实现的新加坡高效多语言语音识别 / Polyglot-Lion: Efficient Multilingual ASR for Singapore via Balanced Fine-Tuning of Qwen3-ASR

1️⃣ 一句话总结

这篇论文提出了一种名为Polyglot-Lion的高效多语言语音识别模型，它通过平衡微调中等规模预训练模型，以极低的成本实现了与庞大专业系统相媲美的性能，特别适用于新加坡的英语、汉语、泰米尔语和马来语环境。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16277

arXiv 提交日期: 2026-03-17

machine learning model training systems neural pde solver physics-integrated differentiable modeling immersed boundary method fluid dynamics

用于浸没边界系统的物理集成神经可微分建模 / Physics-integrated neural differentiable modeling for immersed boundary systems

1️⃣ 一句话总结

这项研究提出了一种结合物理原理与深度学习的新方法，能够用较粗的网格和大的时间步长，快速、稳定且准确地预测流体在固体边界附近的长时程流动，相比传统高精度模拟提速约200倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16137

arXiv 提交日期: 2026-03-17

llm systems model training knowledge grounding safety alignment e-commerce search parameter-efficient training industrial deployment

SIA：一种用于构建具备工业部署能力的知识型安全电商搜索大语言模型的合成-注入-对齐框架 / SIA: A Synthesize-Inject-Align Framework for Knowledge-Grounded and Secure E-commerce Search LLMs with Industrial Deployment

1️⃣ 一句话总结

这篇论文提出了一个名为SIA的框架，通过合成高质量数据、高效注入领域知识和双路径对齐训练，解决了大语言模型在电商搜索中容易产生知识幻觉和安全漏洞的问题，并已在中国最大自营电商平台成功部署，显著提升了业务指标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.17484

1️⃣ 一句话总结

arXiv ID: 2603.16062

1️⃣ 一句话总结

arXiv ID: 2603.16987

1️⃣ 一句话总结

arXiv ID: 2603.16870

1️⃣ 一句话总结

arXiv ID: 2603.17024

1️⃣ 一句话总结

arXiv ID: 2603.16840

1️⃣ 一句话总结

arXiv ID: 2603.16812

1️⃣ 一句话总结

arXiv ID: 2603.16184

1️⃣ 一句话总结

arXiv ID: 2603.16277

1️⃣ 一句话总结

arXiv ID: 2603.16137

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.17484 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16062 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16987 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16870 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.17024 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16840 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16812 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16184 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16277 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16137 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.17484

arXiv ID: 2603.16062

arXiv ID: 2603.16987

arXiv ID: 2603.16870

arXiv ID: 2603.17024

arXiv ID: 2603.16840

arXiv ID: 2603.16812

arXiv ID: 2603.16184

arXiv ID: 2603.16277

arXiv ID: 2603.16137