arXiv ID:
2604.20398
arXiv 提交日期: 2026-04-22
WebGen-R1:利用强化学习激励大语言模型生成功能完善且美观的网站 / WebGen-R1: Incentivizing Large Language Models to Generate Functional and Aesthetic Websites with Reinforcement Learning
1️⃣ 一句话总结
本文提出一种名为WebGen-R1的端到端强化学习框架,通过创新的结构化生成方法和多模态奖励机制,成功将仅有7B参数的小型语言模型从几乎无法生成有效网页训练成能产出功能完整、视觉美观的多页网站,性能超越了高达72B的开源模型,并在功能正确性与美观度上媲美671B的顶尖模型。