arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: VideoLatent: Video-Language Learning via Latent Self-Forcing 06-23

arXiv ID: 2606.22870

arXiv 提交日期: 2026-06-22

multi-modal llm model training video understanding latent reasoning multimodal llm efficiency chain-of-thought

VideoLatent：通过潜在自强制学习视频语言 / VideoLatent: Video-Language Learning via Latent Self-Forcing

1️⃣ 一句话总结

为了高效且低成本地提升多模态大模型对视频的理解与推理能力，本文提出了一种名为VideoLatent的新方法，它让模型在内部自动进行“潜在推理”，仅需视频、问题和答案这类简单数据即可训练，不仅性能全面超越现有模型，还将训练和推理的计算开销分别降低至原来的六分之一和六十八分之一。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.22946

arXiv 提交日期: 2026-06-22

machine learning model training model evaluation neural operator neural process probabilistic learning partial observations operator learning

神经算子过程：部分观测下的概率算子学习 / Neural Operator Processes for Probabilistic Operator Learning under Partial Observations

1️⃣ 一句话总结

本文提出了一种名为神经算子过程（NOPs）的新框架，它结合了神经过程的条件化能力与神经算子的解码能力，使得在仅有稀疏或部分观测数据的情况下，也能进行不确定性的预测，从而为科学问题中常见的有限观测场景提供了概率算子学习方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.23362

arXiv 提交日期: 2026-06-22

machine learning data model training backdoor attack diffusion model trigger optimization poison rate stealthiness

TooBad：基于超低投毒率和不可察觉触发器的后门扩散模型 / TooBad: Backdoor Diffusion Models with Ultra-Low Poison Rate and Imperceptible Trigger

1️⃣ 一句话总结

本文提出了一种针对扩散模型的新型后门攻击框架TooBad，通过优化触发器设计，仅需极低比例（0.5%）的恶意训练数据，就能在不影响模型正常生成能力的前提下，高效植入后门，且能轻松绕过现有防御手段，揭示了扩散模型面临的新型安全威胁。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.22942

arXiv 提交日期: 2026-06-22

llm model training knowledge distillation post-training instruction tuning low-data regimes student model

理解后训练阶段的知识蒸馏：何时有效与何时失效 / Understanding Knowledge Distillation in Post-Training: When It Helps and When It Fails

1️⃣ 一句话总结

本研究系统分析了在大型语言模型的后训练阶段中，知识蒸馏技术如何帮助小型学生模型提升性能，发现当训练数据较少时蒸馏效果显著优于传统微调，但在数据充足时优势减弱；不过，若使用更强的指令微调教师模型，即使在数据丰富的情况下也能带来明显提升，并针对数据稀缺场景提出了一个两阶段蒸馏策略来进一步优化模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.22807

arXiv 提交日期: 2026-06-22

systems model training model evaluation reranking encoder-decoder efficiency matryoshka embedding benchmark

KaLM-Reranker-V1：快速但不晚交互的压缩文档重排序 / KaLM-Reranker-V1: Fast but Not Late Interaction for Compressed Document Reranking

1️⃣ 一句话总结

本文提出了一种名为KaLM-Reranker-V1的新型文档重排序模型，通过将查询和文档的计算过程分离（编码器预编码文档，解码器处理查询意图），再使用交叉注意力机制捕捉相关性，从而在保持高效推理速度的同时，实现了与顶尖模型相当的重排序性能，并且小模型也能达到大型嵌入模型的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.22744

arXiv 提交日期: 2026-06-22

machine learning model training predictive coding backpropagation alternative deep networks highway propagation local learning

误差高速公路：将预测编码扩展到非常深的网络 / Error Highways: Scaling Predictive Coding to Very Deep Networks

1️⃣ 一句话总结

本文提出了一种名为“高速公路误差传播”的方法，通过在预测编码网络中为深层隐藏层直接引入输出误差的线性反馈，解决了传统预测编码在深层网络中学习信号快速衰减的问题，从而能够有效训练多达128层的神经网络，且精度不受深度影响。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.23682

arXiv 提交日期: 2026-06-22

computer vision model training systems diffusion model token dropping reference-based generation inference efficiency image editing

保留要点：通过令牌丢弃实现高效的参考条件生成 / Keep The Essentials: Efficient Reference Conditioned Generation via Token Dropping

1️⃣ 一句话总结

本文提出一种名为Sparse Context的方法，通过在推理时丢弃大部分参考图像的冗余令牌（token），并微调模型以适应随机丢失模式，在不降低生成质量的前提下，将多参考图像生成速度提升4倍、单参考生成速度提升2倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.22935

arXiv 提交日期: 2026-06-22

machine learning model training model compression pruning quantization mixture of experts cnn optimization

混合压缩：融合剪枝与量化的优化神经网络方法 / Hybrid Compression: Integrating Pruning and Quantization for Optimized Neural Networks

1️⃣ 一句话总结

本文提出一种两阶段的神经网络压缩方法，先通过剪枝和量化大幅缩小模型体积，再用混合专家架构调度多个小型压缩模型，在几乎不损失准确率的情况下显著降低计算量和参数量，从而让深度模型能够在存储和算力有限的嵌入式设备上高效运行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.23588

arXiv 提交日期: 2026-06-22

agents model training generative model traffic simulation closed-loop transformer

信号交叉口闭环微观仿真的生成式模型 / A Generative Model for Closed-Loop Microsimulation of Signalized Intersections

1️⃣ 一句话总结

本文提出了一种名为Enactor的生成式模型，通过将车辆行为建模为以路口为中心的极坐标变换，并结合闭环训练策略，实现了对信号交叉口车辆交互的稳定、高精度微观仿真，在模拟速度和行程时间分布上大幅优于传统基线模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.23112

arXiv 提交日期: 2026-06-22

agents model training natural language processing tool use preference learning multi-turn self-improvement dpo

基于分歧点偏好学习的多轮工具调用智能体自我进化 / Self-Evolution for Multi-Turn Tool-Calling Agents via Divergence-Point Preference Learning

1️⃣ 一句话总结

本文提出一种名为ToolGraph的新方法，通过构建工具调用关系的拓扑图和基于成功轨迹的权重估计，并结合分歧点偏好的强化学习，使多轮对话中的工具调用智能体能自我改进，在测试中将平均奖励从0.304提升至0.355，性能相对提升16.8%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.22870

1️⃣ 一句话总结

arXiv ID: 2606.22946

1️⃣ 一句话总结

arXiv ID: 2606.23362

1️⃣ 一句话总结

arXiv ID: 2606.22942

1️⃣ 一句话总结

arXiv ID: 2606.22807

1️⃣ 一句话总结

arXiv ID: 2606.22744

1️⃣ 一句话总结

arXiv ID: 2606.23682

1️⃣ 一句话总结

arXiv ID: 2606.22935

1️⃣ 一句话总结

arXiv ID: 2606.23588

1️⃣ 一句话总结

arXiv ID: 2606.23112

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.22870 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.22946 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.23362 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.22942 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.22807 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.22744 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.23682 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.22935 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.23588 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.23112 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.22870

arXiv ID: 2606.22946

arXiv ID: 2606.23362

arXiv ID: 2606.22942

arXiv ID: 2606.22807

arXiv ID: 2606.22744

arXiv ID: 2606.23682

arXiv ID: 2606.22935

arXiv ID: 2606.23588

arXiv ID: 2606.23112