arXiv ID:
2602.09936
arXiv 提交日期: 2026-02-10
k均值算法在高维空间的灾难性失效及哈蒂根算法如何避免它 / The Catastrophic Failure of The k-Means Algorithm in High Dimensions, and How Hartigan's Algorithm Avoids It
1️⃣ 一句话总结
这篇论文证明,在高维、高噪声数据中,经典的Lloyd k均值算法会完全失效,几乎任何初始划分都会成为最终结果,而Hartigan的k均值算法则能避免这个问题,从而解释了为何高维数据下k均值效果不佳。