arXiv ID:
2603.03068
基于符号奖励机的强化学习 / Reinforcement Learning with Symbolic Reward Machines
1️⃣ 一句话总结
这篇论文提出了一种名为‘符号奖励机’的新方法,它能自动理解强化学习任务的目标,无需人工预先设定规则,在保持高性能的同时让任务目标对用户更透明易懂。
基于符号奖励机的强化学习 / Reinforcement Learning with Symbolic Reward Machines
这篇论文提出了一种名为‘符号奖励机’的新方法,它能自动理解强化学习任务的目标,无需人工预先设定规则,在保持高性能的同时让任务目标对用户更透明易懂。
揭示正负榜样以辅助决策 / Revealing Positive and Negative Role Models to Help People Make Good Decisions
这篇论文提出了一种在社交网络中,通过有选择地向人们揭示其周围榜样是‘好榜样’还是‘坏榜样’来引导他们做出更好决策的方法,并设计了高效的算法来最大化这种引导的社会效益。
孟加拉语长篇幅语音转录与说话人日志化的多种方法研究 / An Investigation Into Various Approaches For Bengali Long-Form Speech Transcription and Bengali Speaker Diarization
本研究针对孟加拉语这一低资源语言,通过结合微调Whisper模型进行语音转录和集成pyannote模型进行说话人分离的多阶段方法,有效解决了长达一小时的录音中‘谁在何时说了什么’的难题,显著提升了相关AI任务的性能。
EdgeFLow:一种通过边缘网络中顺序模型迁移实现的无服务器联邦学习框架 / EdgeFLow: Serverless Federated Learning via Sequential Model Migration in Edge Networks
这篇论文提出了一种名为EdgeFLow的新方法,它通过让模型在边缘基站之间像接力棒一样顺序传递和聚合,完全绕开云端服务器,从而在保证学习效果的同时,大幅降低了物联网设备进行联邦学习时的通信开销。
QFlowNet:基于生成流网络的快速、多样且高效的酉矩阵合成 / QFlowNet: Fast, Diverse, and Efficient Unitary Synthesis with Generative Flow Networks
这篇论文提出了一个名为QFlowNet的新框架,它结合了生成流网络和Transformer模型,能够快速、高效地为量子计算机生成多种多样的高质量量子门电路,解决了传统强化学习方法训练慢、结果单一的问题。
基于贝叶斯对抗多智能体框架的AI-for-Science低代码平台 / AI-for-Science Low-code Platform with Bayesian Adversarial Multi-Agent Framework
这篇论文提出了一种结合贝叶斯推理和对抗性测试的多智能体低代码平台,旨在通过让多个AI智能体相互协作与挑战,自动生成更可靠、更符合需求的科学计算代码,从而降低非编程专家的使用门槛并提升代码质量。
UniSkill:一个用于匹配大学课程与职业能力的数据集 / UniSkill: A Dataset for Matching University Curricula to Professional Competencies
这篇论文发布了一个名为UniSkill的新数据集,用于将大学课程内容与职业所需技能进行匹配,并训练了一个高效的AI模型来支持课程与技能之间的双向推荐。
SemGS:基于稀疏视图的前馈式语义3D高斯泼溅用于可泛化的场景理解 / SemGS: Feed-Forward Semantic 3D Gaussian Splatting from Sparse Views for Generalizable Scene Understanding
这项研究提出了一种名为SemGS的新方法,它能够仅用少数几张照片就快速重建出带有物体类别信息的3D场景模型,并能从任意新角度生成清晰的语义分割图,大大提升了机器人在复杂环境中理解场景的效率和实用性。
ExpGuard:专业领域的大型语言模型内容审核 / ExpGuard: LLM Content Moderation in Specialized Domains
这篇论文提出了一个名为ExpGuard的专业领域内容审核模型,它通过一个精心构建的数据集,专门保护金融、医疗和法律等专业领域的AI对话免受有害内容攻击,并在对抗性测试中显著优于现有通用审核模型。
基于类型感知检索增强生成与依赖闭包的求解器可执行工业优化建模 / Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling
这篇论文提出了一种新方法,通过强制要求模型实体类型完整和依赖关系闭合,让大语言模型能更可靠地将自然语言需求自动转换成可直接运行的工业优化代码,解决了现有方法常因类型错误或依赖缺失导致代码无法执行的问题。
请先 登录 后再提交论文