arXiv ID:
2601.15849
arXiv 提交日期: 2026-01-22
CGPT:用于表格检索的基于聚类引导的部分表格与LLM生成监督 / CGPT: Cluster-Guided Partial Tables with LLM-Generated Supervision for Table Retrieval
1️⃣ 一句话总结
这篇论文提出了一个名为CGPT的训练框架,它通过聚类技术构建语义多样的部分表格,并利用大语言模型为这些表格生成查询作为监督信号,通过对比学习微调嵌入模型,从而显著提升了大规模表格检索的效果和跨领域泛化能力。