arXiv最新AI论文速览速学

🔍

标签: #information gain ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws 03-16

arXiv ID: 2603.12365

arXiv 提交日期: 2026-03-12

machine learning model training theory bayesian experimental design parameter identification constitutive models information gain surrogate modeling

面向历史相关本构模型可靠学习的最优实验设计 / Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws

1️⃣ 一句话总结

这篇论文提出了一种基于贝叶斯最优实验设计的框架，通过智能规划实验方案（如试样形状和加载路径），用更少的物理实验成本，更可靠地确定材料本构模型中的参数，特别是那些描述材料“记忆效应”的关键参数。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17532

arXiv 提交日期: 2026-01-24

llm natural language processing model evaluation retrieval-augmented generation evidence selection reranking information gain question answering

检索增强生成中的“少即是多”：基于信息增益剪枝的生成器对齐重排序与证据选择 / Less is More for RAG: Information Gain Pruning for Generator-Aligned Reranking and Evidence Selection

1️⃣ 一句话总结

这篇论文提出了一种名为‘信息增益剪枝’的新方法，它能在不改变现有系统接口的前提下，智能地筛选出对生成答案真正有用的检索文本，从而在显著减少输入信息量的同时，大幅提升问答系统的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.14967

arXiv 提交日期: 2025-10-16

llm agents reinforcement learning multi-turn agents policy optimization information gain credit assignment reward shaping

基于信息增益的策略优化：一种简单有效的多轮大语言模型智能体训练方法 / Information Gain-based Policy Optimization: A Simple and Effective Approach for Multi-Turn LLM Agents

1️⃣ 一句话总结

本文提出了一种名为IGPO的强化学习新方法，通过计算模型自身对正确答案概率的增量变化作为每轮交互的奖励，有效解决了多轮任务中奖励稀疏和信用分配困难的问题，显著提升了智能体的准确性和学习效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.12365

1️⃣ 一句话总结

arXiv ID: 2601.17532

1️⃣ 一句话总结

arXiv ID: 2510.14967

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.12365 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17532 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.14967 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.12365

arXiv ID: 2601.17532

arXiv ID: 2510.14967