arXiv ID:
2602.01853
arXiv 提交日期: 2026-02-02
基于Transformer强化学习的A/B测试时间序列实验设计 / Designing Time Series Experiments in A/B Testing with Transformer Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种结合Transformer和强化学习的新方法,用于解决在随时间顺序分配策略的A/B测试中,如何更有效地利用全部历史数据来优化实验设计,从而更准确地评估策略效果。