arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: TextOVSR: Text-Guided Real-World Opera Video Super-Resolution 03-17

arXiv ID: 2603.15153

arXiv 提交日期: 2026-03-16

computer vision video model training video super-resolution text-guided generation real-world degradation cross-modal fusion opera video benchmark

TextOVSR：文本引导的真实世界戏曲视频超分辨率 / TextOVSR: Text-Guided Real-World Opera Video Super-Resolution

1️⃣ 一句话总结

这篇论文提出了一种名为TextOVSR的新方法，通过引入描述画面退化和内容的两种文本提示来指导模型，有效解决了老旧戏曲视频因设备限制和长期存储导致的画质模糊问题，从而能更真实、细致地恢复视频的纹理细节。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15507

arXiv 提交日期: 2026-03-16

federated learning model training machine learning binary neural networks edge computing model compression privacy-preserving low-cost inference

联邦学习中的二值神经网络：实现低成本推理 / Federated Learning of Binary Neural Networks: Enabling Low-Cost Inference

1️⃣ 一句话总结

这篇论文提出了一种名为FedBNN的新框架，它通过在联邦学习过程中直接训练二值化神经网络，大幅降低了模型在手机等边缘设备上的计算和内存开销，同时保持了与使用传统浮点数模型相近的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14769

arXiv 提交日期: 2026-03-16

llm model training agents generative optimization stochastic optimization meta-learning priority queue exploration-exploitation

POLCA：基于大语言模型的随机生成式优化框架 / POLCA: Stochastic Generative Optimization with LLM

1️⃣ 一句话总结

这篇论文提出了一个名为POLCA的新型优化框架，它利用大语言模型作为优化器，通过结合奖励反馈和历史经验，高效且鲁棒地自动优化复杂的系统（如提示词或多轮智能体），并在多种任务上超越了现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15584

arXiv 提交日期: 2026-03-16

machine learning systems model training physics-informed neural networks neural operators computational physics lithography simulation electromagnetic wave diffraction

用于光刻掩模极紫外电磁波衍射模拟的物理信息神经网络系统 / Physics-Informed Neural Systems for the Simulation of EUV Electromagnetic Wave Diffraction from a Lithography Mask

1️⃣ 一句话总结

这篇论文提出了一种结合物理知识和神经网络的新方法，能快速且准确地模拟极紫外光刻掩模的电磁波衍射过程，显著提升了下一代芯片制造中掩模设计与优化的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14916

arXiv 提交日期: 2026-03-16

multi-modal model evaluation model training image editing human preference reward model mllm reinforcement learning

EditHF-1M：一个百万规模、包含丰富人类偏好反馈的图像编辑数据集 / EditHF-1M: A Million-Scale Rich Human Preference Feedback for Image Editing

1️⃣ 一句话总结

这篇论文创建了一个包含百万图像和大量人类偏好评分的大规模数据集EditHF-1M，并基于此训练了一个能评估图像编辑质量的AI模型，该模型不仅能准确判断编辑效果，还能作为奖励信号来帮助其他图像编辑AI模型通过强化学习进行自我优化和提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15038

arXiv 提交日期: 2026-03-16

machine learning model training systems surrogate modeling neural ode convolutional autoencoder reduced-order model reacting flows

用于瞬态对冲火焰代理建模的卷积自编码器与神经常微分方程框架 / A convolutional autoencoder and neural ODE framework for surrogate modeling of transient counterflow flames

1️⃣ 一句话总结

这项研究提出了一种结合卷积自编码器和神经常微分方程的新方法，能够高效压缩并精确预测二维瞬态火焰从点火到稳定燃烧的整个动态演化过程，误差极低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14923

arXiv 提交日期: 2026-03-16

llm model training theory transformers attention mechanisms mechanistic interpretability routing model efficiency

Transformer中的定向路由机制 / Directional Routing in Transformers

1️⃣ 一句话总结

这篇论文提出了一种名为‘定向路由’的轻量级机制，它能让Transformer模型中的注意力头学会协作，极大地提升了模型理解和记忆事实的能力，但移除这个协作机制会使模型性能崩溃，而单独移除某个注意力头影响却很小。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15475

arXiv 提交日期: 2026-03-16

computer vision model training model evaluation domain adaptation panoramic segmentation open-set learning geometric distortion semantic alignment

超越所见：用于全景分割的外推式域适应方法 / Seeing Beyond: Extrapolative Domain Adaptive Panoramic Segmentation

1️⃣ 一句话总结

本文提出了一种名为EDA-PSeg的新框架，通过创新的角度注意力机制和图匹配适配器，解决了在训练时使用普通视角图像、测试时使用360度全景图像所面临的几何变形和未知类别识别的难题，从而实现了跨域环境下更鲁棒的全景场景理解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15411

arXiv 提交日期: 2026-03-16

biology machine learning model training hybrid modeling parameter calibration multi-task learning crop prediction biophysical models

通过动态参数校准与多任务学习的作物预测混合建模框架 / A Hybrid Modeling Framework for Crop Prediction Tasks via Dynamic Parameter Calibration and Multi-Task Learning

1️⃣ 一句话总结

这篇论文提出了一种结合深度学习和传统作物生长模型的混合方法，通过神经网络动态校准模型参数并利用多任务学习共享数据，在保证预测结果符合生物学规律的同时，显著提高了作物物候期和抗寒性的预测精度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15011

arXiv 提交日期: 2026-03-16

computer vision multi-modal model training chemical diagram parsing vision-language models visual prompting reinforcement learning benchmark

用于化学反应图解析的分子标识符视觉提示与可验证强化学习 / Molecular Identifier Visual Prompt and Verifiable Reinforcement Learning for Chemical Reaction Diagram Parsing

1️⃣ 一句话总结

这篇论文通过引入分子标识符作为视觉提示来激活模型化学知识，并结合一种可验证的强化学习算法，有效提升了视觉语言模型在解析化学反应图时的准确性和泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.15153

1️⃣ 一句话总结

arXiv ID: 2603.15507

1️⃣ 一句话总结

arXiv ID: 2603.14769

1️⃣ 一句话总结

arXiv ID: 2603.15584

1️⃣ 一句话总结

arXiv ID: 2603.14916

1️⃣ 一句话总结

arXiv ID: 2603.15038

1️⃣ 一句话总结

arXiv ID: 2603.14923

1️⃣ 一句话总结

arXiv ID: 2603.15475

1️⃣ 一句话总结

arXiv ID: 2603.15411

1️⃣ 一句话总结

arXiv ID: 2603.15011

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.15153 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15507 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14769 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15584 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14916 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15038 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14923 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15475 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15411 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15011 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.15153

arXiv ID: 2603.15507

arXiv ID: 2603.14769

arXiv ID: 2603.15584

arXiv ID: 2603.14916

arXiv ID: 2603.15038

arXiv ID: 2603.14923

arXiv ID: 2603.15475

arXiv ID: 2603.15411

arXiv ID: 2603.15011