arXiv ID:
2512.03704
DZ-TDPO:用于长对话中可变状态追踪的非破坏性时间对齐方法 / DZ-TDPO: Non-Destructive Temporal Alignment for Mutable State Tracking in Long-Context Dialogue
1️⃣ 一句话总结
这篇论文提出了一种名为DZ-TDPO的新方法,它通过智能调整模型对过去对话的关注方式,让AI助手在长对话中能更灵活地跟踪用户意图的变化,而不会破坏模型原有的通用能力。