arXiv最新AI论文速览速学

🔍

标签: #generalization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Optimal scenario design for climate emulation 06-22

arXiv ID: 2606.19302

arXiv 提交日期: 2026-06-17

machine learning climate model training scenario design generalization emulators optimization data augmentation

面向气候模拟的最优情景设计方法 / Optimal scenario design for climate emulation

1️⃣ 一句话总结

本文提出一种通过优化训练数据（即气候变化情景）来提升AI气候模拟器泛化能力的方法，发现使用精心设计的一个优化情景训练出的模拟器，其预测效果甚至超过用六个传统标准情景训练出的模型，从而为在计算资源有限时如何高效构建高质量气候代理模型提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.16517

arXiv 提交日期: 2026-06-15

biology llm model training post-training generalization reinforcement learning supervised fine-tuning over-specialization

后训练如何塑造生物推理模型 / How Post-Training Shapes Biological Reasoning Models

1️⃣ 一句话总结

本文通过对比实验发现，针对生物数据的推理模型在后期训练中，不同阶段（持续预训练、监督微调、强化学习）对领域内和领域外性能的影响各不相同，其中强化学习能在监督微调导致的过度专业化后部分恢复泛化能力，因此最佳策略是减少监督微调、增加强化学习投入。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15301

arXiv 提交日期: 2026-06-13

reinforcement learning machine learning theory deep reinforcement learning lattice reduction self-play monte carlo tree search generalization

通过自我对弈发现格基约简策略 / Discovering Lattice Reduction Strategies via Self-Play

1️⃣ 一句话总结

本工作将格基约简问题建模为单人马尔可夫决策过程，并利用类似AlphaZero的深度强化学习方法，训练出一个名为DeltaStar的神经网络策略；该策略仅在8维小规模格上训练，就能在无需重新训练的情况下，零样本推广到更高维度的格，并比经典的LLL算法使用更少的操作步骤。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15117

arXiv 提交日期: 2026-06-13

multi-modal audio video deepfake detection domain adaptation teacher-student ensemble generalization

基于师生结构的集成音视频深度伪造检测领域自适应方法 / Teacher-Student Structure for Domain Adaptation in Ensemble Audio-Visual Video Deepfake Detection

1️⃣ 一句话总结

本文提出了一种结合师生框架的集成音视频深度伪造检测模型（EAV-DFD），通过仅利用少量新领域数据训练学生模型，能有效适应未知数据域，在多个跨域测试集上显著提升了检测性能，并具备判断伪造来自音频还是视频的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05778

arXiv 提交日期: 2026-06-04

computer vision machine learning aesthetic assessment relative learning image editing dataset generalization

超越绝对评分：基于编辑差异的相对学习实现通用图像美学评估 / Beyond Absolute Scores: Relative Edit-induced Difference for Generalizable Image Aesthetic Assessment

1️⃣ 一句话总结

本文提出一种名为RED-Aes的新方法，通过利用图像编辑工具模拟人类对比审美过程，让模型学习不同编辑操作如何改变图像美感，而非直接预测评分，从而大幅提升模型在多种场景下的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.04429

arXiv 提交日期: 2026-06-03

theory machine learning generalization flatness neural networks multi-index models interpolators

平坦性与泛化：用齐次神经网络学习多指标模型 / Flatness and Generalization: Learning Multi-Index Models with Homogeneous Neural Networks

1️⃣ 一句话总结

本文针对两层齐次神经网络在学习未知多指标模型时，发现虽然网络对称性可以让某些解变平坦或变尖锐，但“最平坦”的解（即所有解中平坦度最小的解）与泛化性能之间仍存在可靠联系：一方面，存在一类无法通过对称性变平坦的非泛化解；另一方面，在数据由多单指标模型生成且误差较小时，任何最平坦的解都能取得很好的泛化效果，从而为“平坦解泛化好”这一经验法则提供了理论支持。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.04994

arXiv 提交日期: 2026-06-03

biology machine learning benchmark tcr epitope prediction generalization benchmark dataset model evaluation

新基准测试显示TCR抗原表位预测模型的泛化能力有限 / New Benchmarking Shows Limited Generalization Power of TCR Antigenic Epitope Prediction Models

1️⃣ 一句话总结

本文通过构建两套全新的、严格定义的基准数据集，系统性地评估了现有T细胞受体（TCR）抗原特异性预测模型的性能，结果发现这些模型在面对未见过的数据时泛化能力很差，远未达到实际应用所需的灵敏度和特异性，从而为下一代算法的开发奠定了基础。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03217

arXiv 提交日期: 2026-06-02

llm theory chain-of-thought in-context learning generalization phase transition linear regression

上下文学习中思维链的渐近理论 / An Asymptotic Theory of Chain-of-Thought in In-Context Learning

1️⃣ 一句话总结

本文通过一个可理论求解的线性回归模型，利用高维随机矩阵工具，推导出思维链推理深度影响泛化误差的精确公式，发现了推理效果从指数提升到饱和甚至下降的相变规律，并揭示了深层推理只有在预训练数据充分且上下文信息丰富时才有效的条件。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03606

arXiv 提交日期: 2026-06-02

llm natural language processing model evaluation arithmetic reasoning robustness adversarial attack generalization benchmark

测试大语言模型算术推理的泛化能力：基于自动数值重映射的攻击方法 / Testing LLM Arithmetic Reasoning Generalization with Automatic Numeric-Remapping Attacks

1️⃣ 一句话总结

本文提出了一种自动化的数值重映射攻击方法，通过在不改变问题逻辑结构的前提下替换其中的数字，来评估大语言模型在算术推理任务中的脆弱性；实验发现，模型在复杂数据集（如GSM8K）上表现显著下降，而在更简洁的数据集上则保持稳定，表明模型的数值推理泛化能力依赖于数据集的结构复杂度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.01955

arXiv 提交日期: 2026-06-01

machine learning robotics multi-modal world action model vla pretraining event-grounded learning action chunk optimization generalization

WALL-WM：在事件连接处构建世界动作模型 / WALL-WM: Carving World Action Modeling at the Event Joints

1️⃣ 一句话总结

WALL-WM提出了一种基于语义事件的世界动作模型，通过将视频-动作学习从固定长度的分块优化转变为以事件为基本单元的视觉-语言-动作预训练，解决了语言、视觉和动作在时间尺度上的不匹配问题，从而在多种场景和任务中实现了更广泛的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.19302

1️⃣ 一句话总结

arXiv ID: 2606.16517

1️⃣ 一句话总结

arXiv ID: 2606.15301

1️⃣ 一句话总结

arXiv ID: 2606.15117

1️⃣ 一句话总结

arXiv ID: 2606.05778

1️⃣ 一句话总结

arXiv ID: 2606.04429

1️⃣ 一句话总结

arXiv ID: 2606.04994

1️⃣ 一句话总结

arXiv ID: 2606.03217

1️⃣ 一句话总结

arXiv ID: 2606.03606

1️⃣ 一句话总结

arXiv ID: 2606.01955

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.19302 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.16517 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15301 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15117 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05778 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.04429 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.04994 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03217 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03606 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.01955 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.19302

arXiv ID: 2606.16517

arXiv ID: 2606.15301

arXiv ID: 2606.15117

arXiv ID: 2606.05778

arXiv ID: 2606.04429

arXiv ID: 2606.04994

arXiv ID: 2606.03217

arXiv ID: 2606.03606

arXiv ID: 2606.01955