arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 124 最新: PRISM: Breaking the O(n) Memory Wall in Long-Context LLM Inference via O(1) Photonic Block Selection 03-24

arXiv ID: 2602.05238

arXiv 提交日期: 2026-02-05

computer vision model training machine learning anomaly detection normalizing flow surface defect industrial inspection feature adaptation

PatchFlow：利用基于流的模型与局部特征进行异常检测 / PatchFlow: Leveraging a Flow-Based Model with Patch Features

1️⃣ 一句话总结

这篇论文提出了一种名为PatchFlow的新方法，它通过结合局部图像块特征和流模型，并引入适配器模块，有效提升了工业产品（如压铸件）表面缺陷的自动检测精度，且无需异常样本进行训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05423

arXiv 提交日期: 2026-02-05

computer vision multi-modal model training 3d reconstruction neural radiance fields novel view synthesis depth estimation bundle adjustment

NeVStereo：一种用于高保真3D任务的NeRF驱动的新视角合成-立体视觉架构 / NeVStereo: A NeRF-Driven NVS-Stereo Architecture for High-Fidelity 3D Tasks

1️⃣ 一句话总结

这篇论文提出了一个名为NeVStereo的新框架，它巧妙地将神经渲染和立体视觉技术结合起来，只用普通拍摄的彩色照片，就能同时高精度地计算出相机位置、深度图、生成新视角画面并重建出高质量的3D模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05416

arXiv 提交日期: 2026-02-05

systems model training model evaluation koopman autoencoder surrogate modeling coastal-ocean modeling reduced-order models temporal stability

用于受迫柔性网格海岸-海洋模型的降阶代理模型 / Reduced-Order Surrogates for Forced Flexible Mesh Coastal-Ocean Models

1️⃣ 一句话总结

这篇论文提出了一种结合气象强迫和边界条件的Koopman自编码器方法，用于快速模拟海岸海洋动力学，相比传统方法，它在保持厘米级精度误差的同时，将计算速度提升了数百到上千倍，从而使得长期气候模拟和集合预报等应用变得可行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05547

arXiv 提交日期: 2026-02-05

llm model training agents reinforcement learning post-training multi-task learning policy optimization reasoning

多任务GRPO：跨任务的可靠大语言模型推理 / Multi-Task GRPO: Reliable LLM Reasoning Across Tasks

1️⃣ 一句话总结

这项研究提出了一种名为MT-GRPO的新算法，通过动态调整任务权重和引入比例保持采样器，有效解决了多任务强化学习训练中常见的性能失衡问题，从而显著提升了模型在所有任务上的最差性能，并提高了训练效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05883

arXiv 提交日期: 2026-02-05

llm model training model evaluation modeling and simulation prompting retrieval-augmented generation fine-tuning determinism

建模与仿真中的大语言模型指南：从核心技术到关键挑战 / A Guide to Large Language Models in Modeling and Simulation: From Core Techniques to Critical Challenges

1️⃣ 一句话总结

这篇论文为建模与仿真领域的从业者提供了一份实用指南，旨在帮助他们识别和避免使用大语言模型时常见的误区（如数据过载、参数设置不当等），从而更明智、更有效地将大语言模型集成到工作流程中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05717

arXiv 提交日期: 2026-02-05

reinforcement learning theory model training policy optimization exploration collapse support coverage gradient alignment regularization

锚定策略优化：通过支持约束修正来缓解探索崩溃 / Anchored Policy Optimization: Mitigating Exploration Collapse Via Support-Constrained Rectification

1️⃣ 一句话总结

这篇论文提出了一种名为‘锚定策略优化’的新方法，通过确保智能体在强化学习中始终覆盖有效的行动选项，解决了现有方法因过度‘锐化’而导致的探索范围崩溃问题，从而在提升任务成功率的同时保持了决策的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05393

arXiv 提交日期: 2026-02-05

llm model training machine learning knowledge transfer training acceleration representation learning pretraining parameter efficiency

晚到早训练：让大语言模型学得更早，从而更快更好 / Late-to-Early Training: LET LLMs Learn Earlier, So Faster and Better

1️⃣ 一句话总结

这篇论文提出了一种名为‘晚到早训练’的新方法，它利用一个已经训练好的小模型来指导一个新的大模型在训练初期就学习到更深层的知识，从而显著加快训练速度并提升最终性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05951

arXiv 提交日期: 2026-02-05

model training aigc computer vision flow matching source distribution text-to-image generative models conditional generation

更好的源，更好的流：为流匹配学习条件依赖的源分布 / Better Source, Better Flow: Learning Condition-Dependent Source Distribution for Flow Matching

1️⃣ 一句话总结

这篇论文提出，在文本生成图像的流匹配模型中，学习一个根据文本条件变化的源分布，而不是使用固定的高斯分布，可以显著提升模型性能，实现更快的收敛和更好的生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05902

arXiv 提交日期: 2026-02-05

llm model training systems post-training quantization model compression calibration low-bit inference successive rounding

用于训练后量化的正则化校准与逐次舍入方法 / Regularized Calibration with Successive Rounding for Post-Training Quantization

1️⃣ 一句话总结

这篇论文提出了一种新的训练后量化方法，通过结合对称与非对称校准的正则化技术，以及一种高效的逐次舍入搜索策略，在仅增加少量计算成本的前提下，显著提升了大语言模型在低比特量化后的性能表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05723

arXiv 提交日期: 2026-02-05

llm financial model training retrieval-augmented generation hallucination mitigation reinforcement learning knowledge verification faithfulness

通过细粒度知识验证缓解金融检索增强生成中的幻觉问题 / Mitigating Hallucination in Financial Retrieval-Augmented Generation via Fine-Grained Knowledge Verification

1️⃣ 一句话总结

这篇论文提出了一种结合细粒度知识验证的强化学习方法，通过将金融回答拆解成最小知识单元并逐一验证其准确性，有效减少了AI在生成金融信息时与检索资料相矛盾的‘幻觉’问题，同时保证了回答的充分性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.05238

1️⃣ 一句话总结

arXiv ID: 2602.05423

1️⃣ 一句话总结

arXiv ID: 2602.05416

1️⃣ 一句话总结

arXiv ID: 2602.05547

1️⃣ 一句话总结

arXiv ID: 2602.05883

1️⃣ 一句话总结

arXiv ID: 2602.05717

1️⃣ 一句话总结

arXiv ID: 2602.05393

1️⃣ 一句话总结

arXiv ID: 2602.05951

1️⃣ 一句话总结

arXiv ID: 2602.05902

1️⃣ 一句话总结

arXiv ID: 2602.05723

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.05238 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05423 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05416 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05547 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05883 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05717 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05393 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05951 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05902 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05723 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.05238

arXiv ID: 2602.05423

arXiv ID: 2602.05416

arXiv ID: 2602.05547

arXiv ID: 2602.05883

arXiv ID: 2602.05717

arXiv ID: 2602.05393

arXiv ID: 2602.05951

arXiv ID: 2602.05902

arXiv ID: 2602.05723