arXiv ID:
2603.02333
arXiv 提交日期: 2026-03-02
扩散语言模型的记忆特性分析:广义提取与采样效应 / Characterizing Memorization in Diffusion Language Models: Generalized Extraction and Sampling Effects
1️⃣ 一句话总结
这篇论文通过建立一个统一的概率提取框架,首次系统性地揭示了扩散语言模型(DLM)的记忆特性,发现其记忆训练数据的能力会随着采样分辨率的提高而严格增强,并且在同等条件下比自回归模型泄露个人信息的风险更低。