arXiv ID:
2606.23032
arXiv 提交日期: 2026-06-22
IPO金融智能体:超越Finance Agent v2的LLM金融分析师评估——以SpaceX(SPCX)首次公开募股为例的自动评分标准生成 / IPO Finance Agent: Evaluation of LLM Financial Analysts beyond Finance Agent v2, with Automated Rubric Generation -- the Case of the SpaceX (SPCX) IPO
1️⃣ 一句话总结
本文提出了一个名为IPO Finance Agent的评估框架,专门用于测试大语言模型在首次公开募股(IPO)尽职调查任务上的表现,通过改进文档检索技术、构建包含1000道问题的数据集以及引入自动生成评分标准的流程,发现阿里云Qwen 3.7 Max模型以每次查询0.30美元的成本达到了79.4%的准确率,远超现有基准。