arXiv最新AI论文速览速学

🔍

标签: #preference optimization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 95 72小时内新更新论文 72h更新 100 最新: Risk-Controllable Multi-View Diffusion for Driving Scenario Generation 03-13

arXiv ID: 2603.11534

arXiv 提交日期: 2026-03-12

multi-modal computer vision model training scenario generation risk modeling multi-view diffusion autonomous driving preference optimization

用于驾驶场景生成的风险可控多视角扩散模型 / Risk-Controllable Multi-View Diffusion for Driving Scenario Generation

1️⃣ 一句话总结

这篇论文提出了一种名为RiskMV-DPO的新方法，它能够根据指定的风险等级，自动生成用于测试自动驾驶汽车安全性的、真实且多样的危险驾驶场景视频，解决了传统方法难以创造罕见高风险场景的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.23391

arXiv 提交日期: 2026-02-24

llm model training model evaluation detoxification preference optimization representation erasure safety robustness

基于表征擦除的偏好优化实现大语言模型脱毒 / Detoxifying LLMs via Representation Erasure-Based Preference Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为REPO的新方法，通过从模型内部表征层面直接消除有害信息，而非仅仅抑制有害输出，从而更根本、更鲁棒地解决大语言模型生成有毒内容的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19163

arXiv 提交日期: 2026-02-22

aigc multi-modal model training audio-video generation diffusion transformer preference optimization temporal alignment mixture-of-experts

JavisDiT++：面向联合音视频生成的统一建模与优化 / JavisDiT++: Unified Modeling and Optimization for Joint Audio-Video Generation

1️⃣ 一句话总结

这篇论文提出了一个名为JavisDiT++的新框架，它通过创新的专家混合模块、时序对齐技术和人类偏好优化方法，显著提升了根据文字描述同时生成高质量、音画同步视频的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11902

arXiv 提交日期: 2026-02-12

llm model training theory preference optimization dpo alignment training mismatch reference policy

缓解基于参考的偏好优化中的不匹配问题 / Mitigating Mismatch within Reference-based Preference Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为HyPO的改进方法，通过有条件地调整参考模型在训练中的作用，解决了现有偏好优化算法在处理‘悲观’数据时过早停止学习的问题，从而在保持训练稳定的同时提升了模型的最终性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11146

arXiv 提交日期: 2026-02-11

model training computer vision multi-modal diffusion models reward modeling preference optimization latent space image alignment

超越基于视觉语言模型的奖励：扩散模型原生潜在奖励建模 / Beyond VLM-Based Rewards: Diffusion-Native Latent Reward Modeling

1️⃣ 一句话总结

这篇论文提出了一种名为DiNa-LRM的新方法，它直接在扩散模型的内部潜在空间中评估图像质量，从而以更低的计算成本实现了与主流视觉语言模型相当的图像偏好对齐效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04224

arXiv 提交日期: 2026-02-04

llm agents model training preference optimization safe reasoning jailbreak attacks risk-aware alignment chain-of-thought

RAPO：面向可泛化安全推理的风险感知偏好优化 / RAPO: Risk-Aware Preference Optimization for Generalizable Safe Reasoning

1️⃣ 一句话总结

本文提出了一种名为RAPO的风险感知优化框架，通过让大型推理模型在思考过程中动态识别并应对不同级别的安全风险，有效提升了模型抵御各种复杂诱导攻击的能力，同时保持了其通用任务性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04493

arXiv 提交日期: 2026-02-04

llm natural language processing model training preference optimization dialogue systems personalization automatic evaluation dpo

PersoDPO：通过多LLM评估实现可扩展的、遵循指令且基于人设的对话偏好优化 / PersoDPO: Scalable Preference Optimization for Instruction-Adherent, Persona-Grounded Dialogue via Multi-LLM Evaluation

1️⃣ 一句话总结

这篇论文提出了一个名为PersoDPO的可扩展训练框架，它通过自动评估多个大语言模型的回复来构建高质量的训练数据，从而让开源对话模型学会生成既符合对话背景、又贴合用户个人特点的回复，效果优于现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03516

arXiv 提交日期: 2026-02-03

llm model training natural language processing negative sampling reasoning reinforcement learning preference optimization mathematical reasoning

并非所有错误样本都同等重要：大语言模型从合理推理中学习效果更佳 / Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为‘合理负样本’的新方法，通过专门生成看起来格式正确、推理过程合理但最终答案是错误的训练样本，来更有效地提升大语言模型在数学推理等任务上的表现，效果优于传统方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.20687

arXiv 提交日期: 2026-01-28

model training reinforcement learning llm preference optimization knowledge distillation on-premise deployment positive-unlabeled learning direct preference optimization

面向本地部署小模型的正例-无标记强化学习蒸馏 / Positive-Unlabeled Reinforcement Learning Distillation for On-Premise Small Models

1️⃣ 一句话总结

本文提出了一种无需人工标注偏好或奖励模型的新方法，通过从大模型（教师模型）的黑箱生成中蒸馏偏好优化能力，使本地部署的小模型也能低成本地实现强化学习对齐，从而提升性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.15968

arXiv 提交日期: 2026-01-22

model training model evaluation aigc diffusion models test-time alignment hypernetwork low-rank adaptation preference optimization

HyperAlign：用于扩散模型高效测试时对齐的超网络 / HyperAlign: Hypernetwork for Efficient Test-Time Alignment of Diffusion Models

1️⃣ 一句话总结

这篇论文提出了一个名为HyperAlign的新方法，它通过训练一个超网络来动态调整扩散模型的生成过程，从而在生成图像时能高效地使其更符合人类审美和语义意图，解决了现有方法在效果、效率和多样性之间难以权衡的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.11534

1️⃣ 一句话总结

arXiv ID: 2602.23391

1️⃣ 一句话总结

arXiv ID: 2602.19163

1️⃣ 一句话总结

arXiv ID: 2602.11902

1️⃣ 一句话总结

arXiv ID: 2602.11146

1️⃣ 一句话总结

arXiv ID: 2602.04224

1️⃣ 一句话总结

arXiv ID: 2602.04493

1️⃣ 一句话总结

arXiv ID: 2602.03516

1️⃣ 一句话总结

arXiv ID: 2601.20687

1️⃣ 一句话总结

arXiv ID: 2601.15968

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.11534 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.23391 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19163 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11902 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11146 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04224 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04493 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03516 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.20687 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.15968 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.11534

arXiv ID: 2602.23391

arXiv ID: 2602.19163

arXiv ID: 2602.11902

arXiv ID: 2602.11146

arXiv ID: 2602.04224

arXiv ID: 2602.04493

arXiv ID: 2602.03516

arXiv ID: 2601.20687

arXiv ID: 2601.15968