arXiv ID:
2603.06397
通过强化学习编译扩散实现高效、属性对齐的扇出检索 / Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion
1️⃣ 一句话总结
这篇论文提出了一种名为R4T的新方法,它先用强化学习训练一个大语言模型来优化检索结果的集合属性(如多样性),然后利用该模型生成训练数据,最终训练一个轻量级的扩散模型来高效地一次性检索出满足复杂属性要求的物品集合,从而在保证质量的同时大幅提升了检索速度。