arXiv ID:
2511.15703
arXiv 提交日期: 2025-11-19
视觉思考,文本推理:ARC中的视觉-语言协同 / Think Visually, Reason Textually: Vision-Language Synergy in ARC
1️⃣ 一句话总结
这篇论文提出了一种结合视觉抽象和语言推理的协同方法,通过视觉辅助模式识别和语言确保规则精确执行,在抽象推理任务ARC-AGI上显著提升了AI模型的性能,为实现更接近人类智能的通用推理能力提供了新思路。