← 返回列表

菜单

🤖 系统
📄 Abstract - Jina-Code-Embeddings: A Novel Code Embedding Model Suite Based on Autoregressive Decoders
正在获取摘要...
顶级标签: llm
详细标签: code embeddings autoregressive decoder last-token pooling code retrieval synthetic data generation 或 搜索:

📄 论文总结

Jina代码嵌入:基于自回归解码器的新型代码嵌入模型套件

Jina-Code-Embeddings: A Novel Code Embedding Model Suite Based on Autoregressive Decoders


1️⃣ 一句话总结

Jina-code-embeddings是一个创新的代码嵌入模型套件,通过使用预训练的代码生成LLMs作为主干网络并采用last-token pooling技术,在相对较小的模型规模下实现了最先进的代码搜索和语义理解性能。


2️⃣ 论文创新点

1. 代码生成模型作为嵌入主干

2. 针对性训练策略开发

3. 任务特定指令前缀设计

4. 合成数据生成方法


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF