arXiv ID:
2605.28567
arXiv 提交日期: 2026-05-27
基于语义最优传输的稀疏自编码器特征匹配与电路压缩 / Semantic Optimal Transport for Sparse Autoencoder Feature Matching and Circuit Compression
1️⃣ 一句话总结
本文提出一种统一框架,通过将每个稀疏自编码器特征表示为激活值加权的隐藏状态分布,并利用最优传输理论中的Wasserstein距离在共享空间中比较这些分布,从而同时解决跨层特征匹配和大规模特征电路压缩两个难题,生成可解释的超级节点。