arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media 05-02

arXiv ID: 2604.28036

arXiv 提交日期: 2026-04-30

machine learning theory exponential families kl divergence variational inference information geometry log-partition function

从单个KL恒等式看指数族分布 / Exponential families from a single KL identity

1️⃣ 一句话总结

本文发现了一个简洁的KL散度恒等式，仅通过它和KL散度非负的性质，无需复杂数学推导，就能统一推导出指数族分布的多个核心结论，包括吉布斯变分原理、投影定理和熵正则化强化学习中的指数倾斜公式等。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27960

arXiv 提交日期: 2026-04-30

llm machine learning reasoning answer set programming self-correction nonmonotonic reasoning neuro-symbolic stable model semantics

作为ASP程序员的LLM：自我修正实现任务无关的非单调推理 / LLMs as ASP Programmers: Self-Correction Enables Task-Agnostic Nonmonotonic Reasoning

1️⃣ 一句话总结

本文提出了一种名为“LLM+ASP”的框架，让大型语言模型自动将自然语言问题转换为回答集程序（一种能处理默认规则和例外的非单调逻辑），并通过求解器的结构化反馈进行自我修正，从而在不依赖人工定制知识的情况下，在多种推理任务上显著优于传统方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27814

arXiv 提交日期: 2026-04-30

machine learning model evaluation probabilistic circuits time series forecasting irregular time series density estimation uncertainty quantification

面向不规则多变量时间序列预测的概率电路模型 / Probabilistic Circuits for Irregular Multivariate Time Series Forecasting

1️⃣ 一句话总结

本文提出了一种名为CircuITS的新型概率电路架构，能够在保证联合概率分布一致性的同时，灵活捕捉不规则时间序列中不同通道间的复杂依赖关系，从而在多个真实数据集上实现了优于现有模型的预测精度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27366

arXiv 提交日期: 2026-04-30

machine learning model training agents vision language action critic framework autonomous driving trajectory refinement bench2drive

先判断，再驾驶：一种以评判者为核心的视觉语言动作自动驾驶框架 / Judge, Then Drive: A Critic-Centric Vision Language Action Framework for Autonomous Driving

1️⃣ 一句话总结

该论文提出了一种名为CriticVLA的自动驾驶新方法，它让AI先像评判者一样评估自己生成的初步驾驶轨迹，再根据评估结果进行优化，从而在复杂场景下显著提升驾驶成功率，实验显示其总成功率高达73.33%，在困难场景中比现有技术提升了约30%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27667

arXiv 提交日期: 2026-04-30

reinforcement learning robotics machine learning tabular foundation model policy optimization continuous control global exploration sample efficiency

表格基础模型能否指导机器人策略学习中的探索？ / Can Tabular Foundation Models Guide Exploration in Robot Policy Learning?

1️⃣ 一句话总结

本文提出了一种名为TFM-S3的混合搜索方法，通过间歇性全局搜索与局部更新结合，并利用预训练的表格基础模型预测策略表现，从而在有限的试错次数下大幅提升机器人连续控制策略学习的探索效率和最终性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27447

arXiv 提交日期: 2026-04-30

machine learning model evaluation theory generative models robust optimization distribution shift portfolio optimization

基于生成模型的采样器鲁棒优化 / Sampler-Robust Optimization under Generative Models

1️⃣ 一句话总结

本文提出一种名为采样器鲁棒优化的新框架，通过扰动生成模型产生的采样器来优化决策，使得决策在生成模型不准确或采样有限时依然表现稳定，并用实验证明该方法在投资组合优化中有效提升了应对分布变化的稳健性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28175

arXiv 提交日期: 2026-04-30

systems model evaluation inference serving priority scheduling latency estimation interference modeling gpu scheduling

Strait：感知机器学习推理服务中的优先级与干扰 / Strait: Perceiving Priority and Interference in ML Inference Serving

1️⃣ 一句话总结

本文提出了一种名为Strait的机器学习推理服务系统，它通过预测GPU上的数据传输冲突和内核执行干扰，并据此进行优先级感知的任务调度，从而在高负载下显著减少高优先级推理请求的截止时间违反率，同时兼顾低优先级任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28167

arXiv 提交日期: 2026-04-30

machine learning theory phase diagram vicsek model clustering neural network collective motion

利用机器学习绘制Vicsek模型的相图 / Mapping the Phase Diagram of the Vicsek Model with Machine Learning

1️⃣ 一句话总结

本研究通过机器学习方法，将Vicsek集群运动模型在三维参数空间中的稀疏模拟数据自动分类为有序、无序和共存三种相态，并训练神经网络模型高精度地预测整个相图边界，从而为群体运动模型提供了一种系统化绘制全局相图的通用方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28031

arXiv 提交日期: 2026-04-30

llm evaluation benchmark constraint adherence multi-turn scientific ideation driftbench knows-but-violates

模型回忆它们所违反的：多轮LLM构思中的约束遵循 / Models Recall What They Violate: Constraint Adherence in Multi-Turn LLM Ideation

1️⃣ 一句话总结

本文通过构建DriftBench基准测试，发现大型语言模型在多轮科学构思迭代中会逐渐偏离原始约束，并揭示了一个关键矛盾：模型能准确回忆约束条件，却在实际生成中频繁违反它们，这种“知而犯之”的现象在不同模型和条件下普遍存在。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27911

arXiv 提交日期: 2026-04-30

systems machine learning foundation models hardware acceleration physical computing energy efficiency neural networks

物理基础模型：大规模神经网络的固定硬件实现 / Physical Foundation Models: Fixed hardware implementations of large-scale neural networks

1️⃣ 一句话总结

本文提出一种全新思路：将万亿参数级别的基础模型（如GPT-5）直接设计成专用物理硬件，利用光、电子等物理现象进行运算，从而大幅提升能效、速度和参数密度，有望将AI从数据中心扩展到边缘设备，并支持更大规模的模型（如千万亿参数）。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.28036

1️⃣ 一句话总结

arXiv ID: 2604.27960

1️⃣ 一句话总结

arXiv ID: 2604.27814

1️⃣ 一句话总结

arXiv ID: 2604.27366

1️⃣ 一句话总结

arXiv ID: 2604.27667

1️⃣ 一句话总结

arXiv ID: 2604.27447

1️⃣ 一句话总结

arXiv ID: 2604.28175

1️⃣ 一句话总结

arXiv ID: 2604.28167

1️⃣ 一句话总结

arXiv ID: 2604.28031

1️⃣ 一句话总结

arXiv ID: 2604.27911

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.28036 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27960 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27814 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27366 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27667 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27447 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28175 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28167 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28031 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27911 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.28036

arXiv ID: 2604.27960

arXiv ID: 2604.27814

arXiv ID: 2604.27366

arXiv ID: 2604.27667

arXiv ID: 2604.27447

arXiv ID: 2604.28175

arXiv ID: 2604.28167

arXiv ID: 2604.28031

arXiv ID: 2604.27911