arXiv ID:
2604.28036
从单个KL恒等式看指数族分布 / Exponential families from a single KL identity
1️⃣ 一句话总结
本文发现了一个简洁的KL散度恒等式,仅通过它和KL散度非负的性质,无需复杂数学推导,就能统一推导出指数族分布的多个核心结论,包括吉布斯变分原理、投影定理和熵正则化强化学习中的指数倾斜公式等。