arXiv ID:
2603.08704
arXiv 提交日期: 2026-03-09
评估大型语言模型的金融智能:基于LLM引擎的SuperInvesting AI基准测试 / Evaluating Financial Intelligence in Large Language Models: Benchmarking SuperInvesting AI with LLM Engines
1️⃣ 一句话总结
这篇论文提出了一个多维度的金融智能评估框架,通过测试发现,在复杂的投资研究任务中,结合了结构化金融数据访问和分析推理能力的AI系统(如SuperInvesting)表现最为可靠。