arXiv ID:
2606.26899
基于扩散Transformer的生成式检索:度量排序序列训练与混合策略偏好优化 / Generative Retrieval via Diffusion Transformer with Metric-Ordered Sequence Training and Hybrid-Policy Preference Optimization
1️⃣ 一句话总结
本文提出了一种新的生成式检索方法MO-DiT+HPPO,通过让模型学习从低到高的属性密度序列,并结合混合策略偏好优化,在保留原有模式的同时精准找到符合目标属性的物品,解决了传统检索方法中模式保持与属性提升之间的矛盾。