arXiv ID:
2605.17937
arXiv 提交日期: 2026-05-18
BacktestBench:面向自动化量化策略回测的大语言模型评测基准 / BacktestBench: Benchmarking Large Language Models for Automated Quantitative Strategy Backtesting
1️⃣ 一句话总结
本文提出了首个大规模自动化量化回测评测基准BacktestBench,包含超过1.8万个基于真实市场数据的问答任务,并设计了一个多智能体基线系统AutoBacktest,以评估和推动大语言模型在自动生成、执行和验证交易策略方面的能力。