← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm
详细标签: token order prediction auxiliary training objective listnet loss multi-token prediction language modeling 或 搜索:

📄 论文总结

通过Token Order Prediction改进语言建模

Improving Language Modeling with Token Order Prediction


1️⃣ 一句话总结

论文提出Token Order Prediction (TOP)作为一种新的辅助训练目标,通过预测未来token的出现顺序而非精确预测具体token,在计算效率和多任务性能上均优于传统的Next-Token Prediction (NTP)和Multi-Token Prediction (MTP)方法。


2️⃣ 论文创新点

1. Token Order Prediction (TOP)

2. ListNet排序损失应用


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF