arXiv ID:
2602.04613
arXiv 提交日期: 2026-02-04
从大语言模型的机器翻译中分离语言与意义 / Disentangling meaning from language in LLM-based machine translation
1️⃣ 一句话总结
这篇论文通过分析大语言模型内部的注意力机制,发现翻译任务被分解为‘生成目标语言文本’和‘保留原句意义’两个独立的子任务,并分别由不同的注意力头负责,通过微调极少数相关头部就能实现高质量的指令无关翻译。