arXiv ID:
2512.13399
可微分进化强化学习 / Differentiable Evolutionary Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为DERL的新方法,它能够像训练智能体一样,自动学习和优化奖励函数本身,从而让AI在复杂的推理任务中更高效地学会如何给自己设定更好的目标。
可微分进化强化学习 / Differentiable Evolutionary Reinforcement Learning
这篇论文提出了一种名为DERL的新方法,它能够像训练智能体一样,自动学习和优化奖励函数本身,从而让AI在复杂的推理任务中更高效地学会如何给自己设定更好的目标。
TraPO:一种用于提升大语言模型推理能力的半监督强化学习框架 / TraPO: A Semi-Supervised Reinforcement Learning Framework for Boosting LLM Reasoning
这篇论文提出了一种名为TraPO的半监督强化学习方法,它巧妙地结合少量标注数据和大量未标注数据来训练大语言模型进行推理,在显著降低数据标注成本的同时,有效防止了模型训练崩溃,并在多个数学推理任务上取得了超越全监督方法的性能。
UAGLNet:一种用于建筑物提取的、结合CNN与Transformer协同工作的不确定性聚合全局-局部融合网络 / UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction
这篇论文提出了一种名为UAGLNet的新方法,通过协同使用CNN和Transformer来更好地捕捉建筑物的全局和局部特征,并引入不确定性估计来提升从遥感图像中提取建筑物轮廓的准确性。
WAY:基于全球AIS轨迹的船舶目的地估计 / WAY: Estimation of Vessel Destination in Worldwide AIS Trajectory
这篇论文提出了一种名为WAY的新型深度学习模型,它能利用全球船舶自动识别系统(AIS)数据,将长距离的港口间航行轨迹重新构建为嵌套序列,从而提前数天甚至数周准确预测船舶的最终目的地。
RecTok:基于修正流的重建蒸馏方法 / RecTok: Reconstruction Distillation along Rectified Flow
这篇论文提出了一种名为RecTok的新方法,通过两种创新的蒸馏技术,成功解决了视觉分词器在高维空间中性能下降的问题,从而在保持图像高保真重建的同时,显著提升了AI图像生成的质量和语义理解能力。
DiffusionBrowser:通过多分支解码器实现交互式扩散预览 / DiffusionBrowser: Interactive Diffusion Previews via Multi-Branch Decoders
这篇论文提出了一个名为DiffusionBrowser的通用解码框架,它能让用户在视频生成过程中随时交互式地预览结果,不仅速度快、能显示多种画面信息,还揭示了AI生成视频的内部工作原理,并提供了新的控制方法。
用于个性化文本到图像生成的方向性文本反转 / Directional Textual Inversion for Personalized Text-to-Image Generation
这项研究提出了一种名为方向性文本反转的新方法,通过只优化文本嵌入向量的方向而非大小,解决了现有技术在复杂文本提示下生成图像效果不佳的问题,从而在保持个性化主体相似性的同时,显著提升了生成图像与文本描述的匹配度。
面向生成任务的可扩展视觉分词器预训练研究 / Towards Scalable Pre-training of Visual Tokenizers for Generation
这篇论文发现传统视觉分词器(如VAE)的预训练存在‘缩放问题’,即单纯追求像素级重建精度无助于提升生成质量,并提出了一种名为VTP的新框架,通过联合优化多种损失函数来让模型学习高级语义,从而实现了生成性能随计算资源投入的有效提升。
文本到图像生成的少步蒸馏:实用指南 / Few-Step Distillation for Text-to-Image Generation: A Practical Guide
这项研究首次系统性地将先进的模型蒸馏技术应用于强大的文本到图像生成模型,通过统一框架分析并解决了从类别标签转向自由文本提示时的关键难题,为实际应用提供了快速、高保真且资源高效的图像生成方案。
通过文本可引导的图像到3D模型进行前馈式3D编辑 / Feedforward 3D Editing via Text-Steerable Image-to-3D
这篇论文提出了一种名为Steer3D的前馈式方法,让现有的图像生成3D模型能够通过简单的文字指令来快速、高质量地编辑生成的3D资产,比现有方法更忠实于指令、更保持原资产一致性,并且速度快了2.4到28.5倍。
请先 登录 后再提交论文