arXiv ID:
2601.20420
arXiv 提交日期: 2026-01-28
概念成分分析:一种用于大语言模型概念提取的原则性方法 / Concept Component Analysis: A Principled Approach for Concept Extraction in LLMs
1️⃣ 一句话总结
这篇论文提出了一种名为‘概念成分分析’的新方法,它基于一个理论模型,通过线性分解大语言模型的内部表示来提取人类可理解的概念,从而解决了现有方法缺乏理论依据的难题。