🤖 系统
11-30 17:37
📄 论文总结
FinLFQA:评估大语言模型在金融长文本问答中的归因文本生成能力 / FinLFQA: Evaluating Attributed Text Generation of LLMs in Financial Long-Form Question Answering
1️⃣ 一句话总结
这篇论文提出了一个名为FinLFQA的金融领域长文本问答基准,用于全面评估大语言模型在生成答案时提供可靠证据、数值推理和专业知识归因的能力,并发现细粒度指标对区分模型性能至关重要。