arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media 05-02

arXiv ID: 2604.18041

arXiv 提交日期: 2026-04-20

llm natural language processing model training personalization judicial reasoning instruction tuning low-resource parameter-efficient fine-tuning

JudgeMeNot：个性化大语言模型以模拟希伯来语司法推理 / JudgeMeNot: Personalizing Large Language Models to Emulate Judicial Reasoning in Hebrew

1️⃣ 一句话总结

这篇论文提出了一种结合合成与有机监督的方法，能够高效地利用少量数据，将大语言模型个性化定制成能模仿特定法官在希伯来语环境下的司法推理风格，其生成结果与真实法官的推理难以区分。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18580

arXiv 提交日期: 2026-04-20

natural language processing model training theory sequence modeling state space models attention mechanisms long-range dependencies recurrent architectures

Sessa：选择性状态空间注意力机制 / Sessa: Selective State Space Attention

1️⃣ 一句话总结

这篇论文提出了一种名为Sessa的新型序列模型，它通过将注意力机制嵌入到反馈路径中，实现了比传统Transformer和Mamba模型更优的长程信息记忆能力，在长上下文任务中表现突出。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18481

arXiv 提交日期: 2026-04-20

theory model training physics-informed neural networks automatic differentiation gradient computation neural network training scientific machine learning

物理信息神经网络：完整训练周期的教学式推导 / Physics-Informed Neural Networks: A Didactic Derivation of the Complete Training Cycle

1️⃣ 一句话总结

这篇论文通过一个具体数值示例，手把手地推导了物理信息神经网络从正向传播、计算损失到反向传播梯度并更新参数的完整训练过程，旨在揭示通常被自动微分库隐藏的底层数学原理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18270

arXiv 提交日期: 2026-04-20

audio model training machine learning incremental learning hebbian learning sound classification kernel plasticity continual learning

基于赫布深度神经网络的音频分类增量学习 / Incremental learning for audio classification with Hebbian Deep Neural Networks

1️⃣ 一句话总结

这篇论文提出了一种受生物启发的赫布学习机制，通过选择性调整深度神经网络中的核心参数来实现音频分类的增量学习，在持续学习新任务时既能有效获取新知识又能稳固保留旧知识，从而在多个学习阶段中取得了比传统方法更优且更稳定的分类性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18266

arXiv 提交日期: 2026-04-20

machine learning data model training anomaly detection tabular data pseudo-labeling data generation unsupervised learning

通过伪标签引导生成增强表格异常检测 / Enhancing Tabular Anomaly Detection via Pseudo-Label-Guided Generation

1️⃣ 一句话总结

这篇论文提出了一种名为PLAG的新方法，它通过巧妙生成高质量的模拟异常数据来训练模型，从而在缺乏真实异常标签的情况下，显著提升了表格数据中异常检测的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18555

arXiv 提交日期: 2026-04-20

model training theory machine learning quantization error analysis randomized algorithms compression

关于TurboQuant与早期DRIVE/EDEN系列工作的说明 / A Note on TurboQuant and the Earlier DRIVE/EDEN Line of Work

1️⃣ 一句话总结

这篇论文澄清了近期TurboQuant量化方法与早期EDEN系列工作的关系，指出TurboQuant是EDEN在特定参数下的子集或次优组合，并通过实验证明优化后的EDEN方法在精度上全面优于TurboQuant。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17473

arXiv 提交日期: 2026-04-19

multi-modal agents model training vision-language navigation state drift memory landmark progress anchoring video llm

双锚定框架：解决视觉语言导航中的状态漂移问题 / Dual-Anchoring: Addressing State Drift in Vision-Language Navigation

1️⃣ 一句话总结

本文提出了一种双锚定框架，通过让智能体明确标记已完成的指令子任务和回忆途经的地标，有效解决了长距离视觉语言导航中因进度混淆和记忆衰减导致的迷失方向问题，将成功率提升了15.2%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17396

arXiv 提交日期: 2026-04-19

llm model training machine unlearning parameter-efficient lora representation space forget-retain trade-off

基于表示引导的参数高效大模型遗忘方法 / Representation-Guided Parameter-Efficient LLM Unlearning

1️⃣ 一句话总结

本文提出了一种名为REGLU的新方法，通过利用模型内部表示空间的几何特性来引导参数微调，从而在删除大模型中的敏感或有害信息时，既能高效地擦除目标内容，又能最大程度地保留模型原有的其他能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17535

arXiv 提交日期: 2026-04-19

llm model training long-context self-distillation on-policy learning hallucination mitigation token-level supervision

OPSDL：面向长上下文语言模型的自蒸馏方法 / OPSDL: On-Policy Self-Distillation for Long-Context Language Models

1️⃣ 一句话总结

本文提出一种名为OPSDL的自蒸馏训练方法，通过让模型利用自身处理短文本的强项作为“教师”，为处理长文本时的每个预测词提供精细指导，从而显著提升大语言模型在长文本场景下的表现，且不损害原有短文本能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17215

arXiv 提交日期: 2026-04-19

llm model training safety alignment gradient-based selection fine-tuning alignment drift continual learning

基于梯度样本选择的持续安全对齐方法 / Continual Safety Alignment via Gradient-Based Sample Selection

1️⃣ 一句话总结

本文研究发现，大语言模型在持续学习新任务时，不同训练样本对安全性的影响差异很大——梯度大的样本容易破坏模型的安全对齐，而梯度适中的样本则能兼顾任务学习和安全保持；基于此，作者提出了一种简单的梯度筛选方法，在微调时自动剔除高梯度样本，从而在不依赖额外安全数据或修改模型结构的情况下，有效防止模型因持续学习而丧失拒绝有害请求、保持诚实等安全能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.18041

1️⃣ 一句话总结

arXiv ID: 2604.18580

1️⃣ 一句话总结

arXiv ID: 2604.18481

1️⃣ 一句话总结

arXiv ID: 2604.18270

1️⃣ 一句话总结

arXiv ID: 2604.18266

1️⃣ 一句话总结

arXiv ID: 2604.18555

1️⃣ 一句话总结

arXiv ID: 2604.17473

1️⃣ 一句话总结

arXiv ID: 2604.17396

1️⃣ 一句话总结

arXiv ID: 2604.17535

1️⃣ 一句话总结

arXiv ID: 2604.17215

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.18041 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18580 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18481 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18270 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18266 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18555 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17473 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17396 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17535 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17215 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.18041

arXiv ID: 2604.18580

arXiv ID: 2604.18481

arXiv ID: 2604.18270

arXiv ID: 2604.18266

arXiv ID: 2604.18555

arXiv ID: 2604.17473

arXiv ID: 2604.17396

arXiv ID: 2604.17535

arXiv ID: 2604.17215