arXiv最新AI论文速览速学

🔍

标签: #educational ai ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 88 72小时内新更新论文 72h更新 188 最新: CODE-GEN: A Human-in-the-Loop RAG-Based Agentic AI System for Multiple-Choice Question Generation 04-11

arXiv ID: 2604.08263

arXiv 提交日期: 2026-04-09

machine learning model evaluation education knowledge tracing neural-symbolic ai interpretability educational ai learner modeling

神经符号知识追踪：将教育知识注入深度学习以实现负责任的学习者建模 / Neural-Symbolic Knowledge Tracing: Injecting Educational Knowledge into Deep Learning for Responsible Learner Modelling

1️⃣ 一句话总结

这篇论文提出了一种名为Responsible-DKT的神经符号知识追踪方法，通过将教育规则（如掌握与未掌握）融入深度学习模型，不仅提升了预测学生表现的准确性和稳定性，还使模型决策过程更可解释，从而支持更负责任、以人为中心的教育人工智能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.03926

arXiv 提交日期: 2026-04-05

llm agents systems rag question generation educational ai human-in-the-loop agentic ai

CODE-GEN：一种基于人类参与循环和检索增强生成的智能体AI系统，用于生成多项选择题 / CODE-GEN: A Human-in-the-Loop RAG-Based Agentic AI System for Multiple-Choice Question Generation

1️⃣ 一句话总结

这篇论文提出了一个名为CODE-GEN的智能体AI系统，它结合了人类专家参与和检索增强生成技术，能自动生成与课程目标匹配的编程多项选择题，并在多个教学维度上表现出高可靠性，同时指出人类专家在需要深度教学判断的环节仍不可或缺。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16663

arXiv 提交日期: 2026-03-17

agents systems multi-agents ai agents peer learning human-ai partnership educational ai agent communities

当开放爪牙智能体相互学习：从涌现的AI智能体社群洞察教育中的人机协作 / When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education

1️⃣ 一句话总结

这篇论文通过观察大规模AI智能体社群中自发产生的学习行为，揭示了四个关键现象，为设计多智能体教育系统提供了自然实验的视角，并提出了‘通过教导你的AI智能体队友来学习’的课程设计构想。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15547

arXiv 提交日期: 2026-03-16

llm natural language processing model evaluation distractor generation educational ai misconception modeling reasoning analysis multiple-choice questions

大型语言模型能否模拟学生的错误推理？一项关于干扰项生成的研究 / Can LLMs Model Incorrect Student Reasoning? A Case Study on Distractor Generation

1️⃣ 一句话总结

这项研究发现，大型语言模型在生成选择题干扰项时，其推理过程与教育科学的最佳实践高度一致，即先得出正确答案，再模拟多种可能的错误概念，最后筛选出合理的干扰项，而提供正确答案作为提示能显著提升其生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02775

arXiv 提交日期: 2026-03-03

llm benchmark model evaluation mathematical tutoring pedagogical evaluation multi-turn dialogue fine-tuning educational ai

从解题者到辅导者：使用KMP-Bench评估大语言模型的教学智能 / From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

1️⃣ 一句话总结

这篇论文提出了一个名为KMP-Bench的综合性评估基准，专门用于测试大语言模型在K-8年级数学辅导中的教学能力，发现当前模型虽然擅长解题，但在遵循教学原则（如引导、解释、反馈）方面仍有不足，并证明使用高质量教学对话数据训练可以显著提升模型的辅导效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.00883

arXiv 提交日期: 2026-03-01

llm model evaluation benchmark alignment out-of-distribution educational ai model bias downstream performance

有知识而无智慧：衡量大语言模型与预期影响之间的错位 / Knowledge without Wisdom: Measuring Misalignment between LLMs and Intended Impact

1️⃣ 一句话总结

这篇研究发现，尽管大语言模型在标准测试上表现出色，但在教育儿童等实际任务中，它们的行为与人类专家的期望存在系统性偏差，甚至可能对学习效果产生负面影响，而这种偏差主要源于模型预训练阶段的共同缺陷。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20527

arXiv 提交日期: 2026-02-24

reinforcement learning agents model training apprenticeship learning intelligent tutoring systems pedagogical strategies reward learning educational ai

一种用于捕捉演化中学生教学策略的广义学徒学习框架 / A Generalized Apprenticeship Learning Framework for Capturing Evolving Student Pedagogical Strategies

1️⃣ 一句话总结

本研究提出了一种名为THEMES的广义学徒学习框架，它通过少量专家演示来推断并模拟动态变化的教学策略，从而在智能辅导系统中高效地制定出优于现有方法的个性化教学决策。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05633

arXiv 提交日期: 2026-02-05

llm benchmark model evaluation personalized safety educational ai safety evaluation student attributes risk assessment

CASTLE：一个用于评估大语言模型中学生定制化个性化安全的综合基准 / CASTLE: A Comprehensive Benchmark for Evaluating Student-Tailored Personalized Safety in Large Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为CASTLE的新评估基准，专门用来测试大语言模型在教育应用中能否根据不同学生的特点（如认知水平和心理状态）提供安全、个性化的回答，而不是对所有学生给出千篇一律的回应，实验发现当前主流模型在这方面都存在明显不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.08263

1️⃣ 一句话总结

arXiv ID: 2604.03926

1️⃣ 一句话总结

arXiv ID: 2603.16663

1️⃣ 一句话总结

arXiv ID: 2603.15547

1️⃣ 一句话总结

arXiv ID: 2603.02775

1️⃣ 一句话总结

arXiv ID: 2603.00883

1️⃣ 一句话总结

arXiv ID: 2602.20527

1️⃣ 一句话总结

arXiv ID: 2602.05633

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.08263 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.03926 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16663 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15547 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02775 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.00883 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20527 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05633 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.08263

arXiv ID: 2604.03926

arXiv ID: 2603.16663

arXiv ID: 2603.15547

arXiv ID: 2603.02775

arXiv ID: 2603.00883

arXiv ID: 2602.20527

arXiv ID: 2602.05633