arXiv ID:
2605.05115
arXiv 提交日期: 2026-05-06
流形操控揭示神经网络表征与行为的共享几何结构 / Manifold Steering Reveals the Shared Geometry of Neural Network Representation and Behavior
1️⃣ 一句话总结
本研究通过对比“沿激活流形操控”与“线性操控”对神经网络行为的影响,发现前者能保持模型输出的自然性和合理性,从而证明了神经网络的内部表征几何结构与最终行为之间存在深刻的因果联系,为可控的模型内部干预提供了新的几何框架。