arXiv最新AI论文速览速学

🔍

标签: #reward models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: $\texttt{MemoryRewardBench}$: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models 01-21

arXiv ID: 2601.11969

arXiv 提交日期: 2026-01-17

llm model evaluation benchmark reward models long-term memory long-context evaluation benchmark memory management

MemoryRewardBench：用于评估大语言模型长期记忆管理能力的奖励模型基准 / $\texttt{MemoryRewardBench}$: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models

1️⃣ 一句话总结

这篇论文提出了首个专门用于评估奖励模型对大语言模型长期记忆管理能力进行自动评分的基准测试，发现开源模型与闭源模型的性能差距正在缩小，并揭示了当前奖励模型在此任务上的能力与局限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.16899

arXiv 提交日期: 2025-12-18

multi-modal benchmark model evaluation reward models multimodal evaluation preference learning interleaved generation llm-as-a-judge

多模态奖励模型基准2：评估交错文本与图像的全能奖励模型 / Multimodal RewardBench 2: Evaluating Omni Reward Models for Interleaved Text and Image

1️⃣ 一句话总结

这篇论文提出了首个用于评估能同时处理图文交错序列的‘全能奖励模型’的综合基准测试MMRB2，通过四个核心任务测试了当前主流模型的性能，发现最先进的模型如Gemini 3 Pro在判断质量上仍显著落后于人类专家，并揭示了未来奖励模型需要改进的关键方向。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.11883

arXiv 提交日期: 2025-12-09

aigc model evaluation multi-modal image generation aesthetic bias reward models alignment risks value alignment

审美对齐的风险：图像生成与奖励模型如何强化审美偏见与意识形态“审查” / Aesthetic Alignment Risks Assimilation: How Image Generation and Reward Models Reinforce Beauty Bias and Ideological "Censorship"

1️⃣ 一句话总结

这篇论文指出，当前流行的AI图像生成模型和其背后的奖励模型过度追求符合大众审美的“漂亮”图像，导致当用户想要生成“反审美”或低质量图像时，AI会无视指令、强行输出“美图”，这实际上形成了一种技术偏见，限制了用户的创作自由和艺术表达的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.11969

1️⃣ 一句话总结

arXiv ID: 2512.16899

1️⃣ 一句话总结

arXiv ID: 2512.11883

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.11969 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.16899 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.11883 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.11969

arXiv ID: 2512.16899

arXiv ID: 2512.11883