arXiv ID:
2606.22019
arXiv 提交日期: 2026-06-20
通道位置限制了潜意识学习的可审计性 / Channel Location Constrains the Auditability of Subliminal Learning
1️⃣ 一句话总结
这篇论文发现,在知识蒸馏中,学生模型能否被提前审计出偷偷学到了老师的隐藏特征,关键不在于模型大小或身份,而在于隐藏特征所依赖的传递通道类型:当特征通过初始化相关通道传递时,审计可行;但当特征通过词汇几何或网络深层计算通道传递时,传统审计方法失效,且即使从标签中删除了目标特征,相关偏好仍会意外转移。