arXiv ID:
2512.10092
arXiv 提交日期: 2025-12-10
可解释嵌入与稀疏自编码器:一种数据分析工具包 / Interpretable Embeddings with Sparse Autoencoders: A Data Analysis Toolkit
1️⃣ 一句话总结
这篇论文提出了一种使用稀疏自编码器生成可解释嵌入的新方法,相比传统的大语言模型和密集嵌入,它能以更低的成本、更高的可控性和可靠性,帮助研究人员分析大规模文本数据,从而发现数据集差异、模型偏见和隐藏概念关联。