arXiv ID:
2605.23036
arXiv 提交日期: 2026-05-21
多语言引导的设计原则:多语言稀疏自编码器与层次选择原理 / Multilingual Steering by Design: Multilingual Sparse Autoencoders and Principled Layer Selection
1️⃣ 一句话总结
本文提出了一种基于多语言数据的稀疏自编码器训练方法,并结合一种新的分层选择规则,显著提升了大型语言模型在多语言场景下语言控制的可解释性和生成质量,为解决跨语言任务中的可靠引导问题提供了理论指导和实践方案。