arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 64 72小时内新更新论文 72h更新 140 最新: TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media 05-02

arXiv ID: 2604.27326

arXiv 提交日期: 2026-04-30

computer vision machine learning hyperspectral image super-resolution attention mechanism frequency modeling sparse attention

光谱动态注意力网络用于高光谱图像超分辨率 / Spectral Dynamic Attention Network for Hyperspectral Image Super-Resolution

1️⃣ 一句话总结

本文提出了一种名为光谱动态注意力网络（SDANet）的新方法，通过动态通道稀疏注意力和频率增强的前馈网络，有效减少高光谱图像中的冗余信息并提升非线性建模能力，从而在超分辨率任务中实现更清晰、更准确的重建效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27720

arXiv 提交日期: 2026-04-30

medical multi-modal model evaluation vision-language models medical vqa grounding failures domain adaptation trustworthiness

对前沿视觉-语言模型在可信医疗视觉问答中的审计：定位失败、格式崩溃与领域适配 / Auditing Frontier Vision-Language Models for Trustworthy Medical VQA: Grounding Failures, Format Collapse, and Domain Adaptation

1️⃣ 一句话总结

本研究系统测试了多个顶尖AI模型在医疗图像问答任务中的可靠性，发现模型在识别身体部位和病变位置时表现很差（准确率不足20%），且当模型需要先定位再回答时，由于格式错误和定位不准，回答质量反而下降，但通过专项训练可以显著提升模型的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27467

arXiv 提交日期: 2026-04-30

llm systems model training code verification code sandboxes execution environment reinforcement learning scalability

ScaleBox：为大型语言模型实现高保真且可扩展的代码验证 / ScaleBox: Enabling High-Fidelity and Scalable Code Verification for Large Language Models

1️⃣ 一句话总结

ScaleBox 是一个专为大规模代码训练设计的高效验证系统，通过自动生成特殊判题规则、细粒度并行执行测试用例以及跨节点无缝协作，显著提升了代码验证的准确性和并发处理能力，从而让大型语言模型在训练和评估中获得更可靠的反馈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27405

arXiv 提交日期: 2026-04-30

llm model evaluation reliable change index llm evaluation item-level analysis churn rate mmlu-pro

超越均值：面向大模型评估的模型内可靠变化检测 / Beyond the Mean: Within-Model Reliable Change Detection for LLM Evaluation

1️⃣ 一句话总结

本文引入临床心理学中的可靠变化指数（RCI），对LLM版本升级（如Llama 3→3.1和Qwen 2.5→3）进行逐题比较，发现平均准确率的小幅提升掩盖了大规模的双向性能波动（有的题目大幅进步，有的严重退步），且多数题目变化无实质意义，因此建议在汇报平均分数时必须同时报告“变化率”指标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27895

arXiv 提交日期: 2026-04-30

machine learning agents model training world models graph neural networks relational inductive bias taxonomy environment modeling

图世界模型：概念、分类与未来方向 / Graph World Models: Concepts, Taxonomy, and Future Directions

1️⃣ 一句话总结

本文首次系统定义了“图世界模型”这一统一研究范式，通过将环境分解为实体节点和交互边，解决了传统世界模型对噪声敏感、错误累积及推理能力弱的问题，并依据关系归纳偏置将其分为空间拓扑抽象、物理动态模拟及逻辑因果推理三类，为构建更鲁棒和可解释的智能体预测与规划系统提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27859

arXiv 提交日期: 2026-04-30

reinforcement learning llm agents agentic rl meta-reasoning self-reflection long-term planning goal-setting

重新思考大型语言模型中的智能体强化学习 / Rethinking Agentic Reinforcement Learning In Large Language Models

1️⃣ 一句话总结

本文探讨了如何将强化学习与大型语言模型结合，使AI不仅能完成预设任务，还能像智能体一样自主设定目标、进行长期规划和动态决策，从而在复杂、不确定的真实环境中更灵活地学习和行动。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28169

arXiv 提交日期: 2026-04-30

video generation aigc computer vision video diffusion physical priors controllable generation physics consistency controlnet

PhyCo：学习可控物理先验以生成运动 / PhyCo: Learning Controllable Physical Priors for Generative Motion

1️⃣ 一句话总结

本文提出了一种名为PhyCo的框架，通过结合大规模物理仿真数据集、物理监督的扩散模型微调以及视觉语言模型引导的优化，使视频生成模型能够精确控制物体的摩擦、弹性等物理属性，从而生成物理上更真实、更可控的运动视频。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28119

arXiv 提交日期: 2026-04-30

machine learning model evaluation sparse autoencoders concept manifolds interpretability representation learning dilution

稀疏自编码器能否捕捉概念流形？ / Do Sparse Autoencoders Capture Concept Manifolds?

1️⃣ 一句话总结

本文发现稀疏自编码器（SAE）虽然被广泛用于提取神经网络的独立线性特征，但实际上概念通常以低维流形（连续几何结构）的形式存在，而SAE要么通过全局覆盖要么通过局部拼贴的方式来捕捉这些流形，但由于其原子分配分散，导致概念流形结构难以被直接识别，因此未来应把几何对象（而非单个方向）作为可解释性的基本单元。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28102

arXiv 提交日期: 2026-04-30

machine learning multi-modal vehicle routing multi-depot multi-task learning transformer optimization

特征级线性调制：面向跨问题多车场车辆路径问题的统一神经求解方法 / FiLMMeD: Feature-wise Linear Modulation for Cross-Problem Multi-Depot Vehicle Routing

1️⃣ 一句话总结

该论文提出了一种名为FiLMMeD的神经网络模型，通过引入特征级线性调制技术，让模型能根据不同的约束条件动态调整内部处理方式，从而统一高效地求解多达24种不同变体的多车场车辆路径问题，并在性能上超越了现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27323

arXiv 提交日期: 2026-04-30

computer vision multi-modal machine learning hyperspectral image sar/lidar multi-source fusion spectral band selection land-cover classification

面向多源遥感图像分类的代表性光谱关联网络 / Representative Spectral Correlation Network for Multi-source Remote Sensing Image Classification

1️⃣ 一句话总结

这篇论文提出了一种名为RSCNet的新型网络框架，通过智能选择高光谱图像中最关键的光谱波段，并让这些波段与SAR或LiDAR等其它遥感数据自适应融合，从而在降低计算成本的同时显著提升地物分类的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.27326

1️⃣ 一句话总结

arXiv ID: 2604.27720

1️⃣ 一句话总结

arXiv ID: 2604.27467

1️⃣ 一句话总结

arXiv ID: 2604.27405

1️⃣ 一句话总结

arXiv ID: 2604.27895

1️⃣ 一句话总结

arXiv ID: 2604.27859

1️⃣ 一句话总结

arXiv ID: 2604.28169

1️⃣ 一句话总结

arXiv ID: 2604.28119

1️⃣ 一句话总结

arXiv ID: 2604.28102

1️⃣ 一句话总结

arXiv ID: 2604.27323

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.27326 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27720 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27467 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27405 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27895 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27859 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28169 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28119 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28102 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27323 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.27326

arXiv ID: 2604.27720

arXiv ID: 2604.27467

arXiv ID: 2604.27405

arXiv ID: 2604.27895

arXiv ID: 2604.27859

arXiv ID: 2604.28169

arXiv ID: 2604.28119

arXiv ID: 2604.28102

arXiv ID: 2604.27323