arXiv最新AI论文速览速学

🔍

标签: #embedding models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 95 72小时内新更新论文 72h更新 100 最新: Geometry-Preserving Aggregation for Mixture-of-Experts Embedding Models 02-22

arXiv ID: 2602.14039

arXiv 提交日期: 2026-02-15

model training natural language processing machine learning mixture-of-experts embedding models geometry-preserving aggregation text embedding

面向专家混合嵌入模型的几何保持聚合方法 / Geometry-Preserving Aggregation for Mixture-of-Experts Embedding Models

1️⃣ 一句话总结

这篇论文发现当前专家混合嵌入模型使用的线性聚合方法会扭曲向量的几何结构，导致性能下降，并提出了一种新的球形聚合方法来解决这个问题，在不增加训练成本的情况下提升了模型在多项任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.03666

arXiv 提交日期: 2026-01-07

multi-modal model training natural language processing cross-modal alignment embedding models modality calibration batch whitening negative curriculum

E5-Omni：面向全模态嵌入的显式跨模态对齐方法 / e5-omni: Explicit Cross-modal Alignment for Omni-modal Embeddings

1️⃣ 一句话总结

这篇论文提出了一种名为e5-omni的轻量级方法，通过校准相似度尺度、优化训练样本难度和统一嵌入空间统计特性，有效解决了现有全模态嵌入模型中跨模态比较不准确、训练效率低的问题，显著提升了文本、图像、音频、视频等多种不同类型数据在同一个空间中进行匹配的鲁棒性和效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.21332

arXiv 提交日期: 2025-12-24

llm natural language processing model training code retrieval embedding models contrastive learning cross-attention pooling benchmark

C2LLM技术报告：通过自适应交叉注意力池化实现代码检索的新前沿 / C2LLM Technical Report: A New Frontier in Code Retrieval via Adaptive Cross-Attention Pooling

1️⃣ 一句话总结

这篇论文提出了一个名为C2LLM的新型代码嵌入模型家族，它通过创新的注意力池化方法，有效聚合代码序列的全部信息，从而在代码检索任务上取得了同类模型中的最佳性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.12541

arXiv 提交日期: 2025-09-16

natural language processing model training data retrieval ranking embedding models unsupervised training information retrieval

zELO：受ELO启发的重排器和嵌入模型训练方法 / zELO: ELO-inspired Training Method for Rerankers and Embedding Models

1️⃣ 一句话总结

这篇论文提出了一种名为zELO的新型训练方法，通过利用无监督数据训练出性能卓越的重排模型，在金融、法律、代码和科学等多个领域的检索任务中超越了现有的闭源模型，并展现出强大的跨领域适应能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.10844

arXiv 提交日期: 2025-09-13

model training machine learning systems model pruning domain adaptation embedding models fisher information gradient alignment

GAPrune：面向领域感知嵌入的梯度对齐剪枝方法 / GAPrune: Gradient-Alignment Pruning for Domain-Aware Embeddings

1️⃣ 一句话总结

本文提出了一种名为GAPrune的智能剪枝方法，它通过分析参数在领域任务中的重要性和通用语义的兼容性，能够在压缩大型嵌入模型的同时保持甚至提升其在金融、化学等专业领域的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.14039

1️⃣ 一句话总结

arXiv ID: 2601.03666

1️⃣ 一句话总结

arXiv ID: 2512.21332

1️⃣ 一句话总结

arXiv ID: 2509.12541

1️⃣ 一句话总结

arXiv ID: 2509.10844

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.14039 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.03666 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.21332 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.12541 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.10844 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.14039

arXiv ID: 2601.03666

arXiv ID: 2512.21332

arXiv ID: 2509.12541

arXiv ID: 2509.10844