arXiv最新AI论文速览速学

🔍

标签: #compute efficiency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models 06-04

arXiv ID: 2606.04396

arXiv 提交日期: 2026-06-03

llm reinforcement learning model training diffusion language models trajectory-aware value head block-wise supervision compute efficiency

读取轨迹，引导路径：面向扩散语言模型的轨迹感知强化学习 / Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models

1️⃣ 一句话总结

提出了一种名为CAPR的新型强化学习算法，通过巧妙利用扩散语言模型生成过程中的“去噪轨迹”信息（即各位置标记逐渐确定的过程），在不进行昂贵树搜索的情况下，实现类似树搜索的精细奖励分配，从而以更低的计算成本显著提升模型在数学推理等任务上的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.28507

arXiv 提交日期: 2026-03-30

machine learning model training theory scaling laws compute efficiency power-law model performance diminishing returns

AI中缩放定律的惊人有效性 / The Unreasonable Effectiveness of Scaling Laws in AI

1️⃣ 一句话总结

这篇论文认为，AI缩放定律之所以能广泛适用并持续推动进步，是因为它抽象掉了具体实现细节，将计算视为一种与实现方式无关的“逻辑计算”，从而既解释了其跨场景的普适性，也揭示了硬件、算法和系统层面持续进行效率竞赛的内在动力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12245

arXiv 提交日期: 2026-03-12

model training computer vision multi-modal diffusion transformers latent interface compute efficiency dynamic inference resource allocation

一个模型，多种预算：用于扩散变换器的弹性潜在接口 / One Model, Many Budgets: Elastic Latent Interfaces for Diffusion Transformers

1️⃣ 一句话总结

这篇论文提出了一种名为ELIT的弹性机制，它能让扩散变换器模型在生成图像时动态调整计算量，通过优先处理重要区域来在保持高质量的同时显著降低计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.14919

arXiv 提交日期: 2025-10-16

llm model evaluation machine learning scaling laws context modeling task performance compute efficiency long-context llms

基于上下文感知的扩展定律预测任务性能 / Predicting Task Performance with Context-aware Scaling Laws

1️⃣ 一句话总结

这项研究提出了一个结合训练计算量和上下文信息来预测大语言模型下游任务表现的新框架，解决了传统扩展定律无法准确评估实际应用效果的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.04396

1️⃣ 一句话总结

arXiv ID: 2603.28507

1️⃣ 一句话总结

arXiv ID: 2603.12245

1️⃣ 一句话总结

arXiv ID: 2510.14919

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.04396 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.28507 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12245 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.14919 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.04396

arXiv ID: 2603.28507

arXiv ID: 2603.12245

arXiv ID: 2510.14919