arXiv ID:
2601.20844
arXiv 提交日期: 2026-01-28
理论上R^2k维空间足以实现基于嵌入的Top-k检索 / $\mathbb{R}^{2k}$ is Theoretically Large Enough for Embedding-based Top-$k$ Retrieval
1️⃣ 一句话总结
这篇论文通过理论和实验证明,在多种相似度度量方式下,仅需2k维的向量空间就足以精确编码所有元素及其子集的关系,从而指出当前基于嵌入的检索系统性能瓶颈主要在于模型的学习能力,而非向量空间的几何限制。