arXiv ID:
2602.09914
arXiv 提交日期: 2026-02-10
AmharicIR+Instr:一个用于神经检索和指令调优的双数据集资源 / AmharicIR+Instr: A Two-Dataset Resource for Neural Retrieval and Instruction Tuning
1️⃣ 一句话总结
这篇论文发布了一个针对低资源语言阿姆哈拉语的双数据集资源,包含一个用于训练和评估神经检索模型的查询-文档三元组数据集,以及一个用于指令跟随文本生成的提示-回答对数据集,旨在支持该语言的检索和生成模型研究。