arXiv ID:
2602.08742
多样化相似性搜索的福利主义公式化方法 / Welfarist Formulations for Diverse Similarity Search
1️⃣ 一句话总结
这篇论文提出了一种基于福利经济学原理的新方法,用于在最近邻搜索中自动且灵活地平衡结果的相关性与多样性,并设计了高效的算法来实现这一目标。
多样化相似性搜索的福利主义公式化方法 / Welfarist Formulations for Diverse Similarity Search
这篇论文提出了一种基于福利经济学原理的新方法,用于在最近邻搜索中自动且灵活地平衡结果的相关性与多样性,并设计了高效的算法来实现这一目标。
PRISM:一种基于增益分解的多智能体推理原则性框架 / PRISM: A Principled Framework for Multi-Agent Reasoning via Gain Decomposition
这篇论文提出了一个名为PRISM的理论框架,将多智能体协作提升大语言模型推理能力的原因分解为探索、信息和聚合三个核心维度,并基于此设计了一个能同时优化这三个维度的新系统,在多个任务上取得了领先的性能和计算效率。
从实证角度理解预测在资源分配中的价值 / Empirically Understanding the Value of Prediction in Allocation
这篇论文开发了一套实证工具包,帮助决策者量化比较在资源分配问题中,投资于预测模型与投资于扩大资源容量或提升服务质量这两种不同策略,哪个能带来更大的实际效益,并通过德国就业服务和埃塞俄比亚扶贫两个真实案例展示了该工具的应用。
幅度距离:一种数据集相似性的几何度量 / Magnitude Distance: A Geometric Measure of Dataset Similarity
这篇论文提出了一种名为‘幅度距离’的新方法,用于衡量不同数据集之间的相似性,它通过一个可调节的参数来捕捉数据的整体结构或局部细节,并且在处理高维数据时依然有效,还能用于训练生成模型。
基于原型的解耦可控构音障碍语音合成 / Prototype-Based Disentanglement for Controllable Dysarthric Speech Synthesis
这篇论文提出了一种名为ProtoDisent-TTS的新方法,它能够将说话人的声音特质和构音障碍的发音特征分离开来,从而可以灵活地生成或转换健康语音与障碍语音,有效提升了语音识别和辅助技术的性能与可控性。
RECUR:一种通过递归熵引导的反事实利用与反思实现的资源耗尽攻击 / RECUR: Resource Exhaustion Attack via Recursive-Entropy Guided Counterfactual Utilization and Reflection
这篇论文提出了一种名为RECUR的攻击方法,它通过构造特殊问题来干扰大型推理模型的反思过程,使其陷入过度计算,从而显著消耗系统资源,揭示了模型推理机制本身存在的安全隐患。
Modalities:一个用于大规模大语言模型训练与研究的PyTorch原生框架 / Modalities, a PyTorch-native Framework For Large-scale LLM Training and Research
这篇论文提出了一个名为Modalities的PyTorch原生框架,它通过集成先进的并行化策略和模块化设计,旨在高效支持万亿级数据、十亿级参数的大语言模型预训练与系统性消融实验,从而解决现有框架在实验管理和可复现性方面的不足。
从障碍到礼仪:基于视觉语言模型路径选择的机器人社会导航 / From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection
这篇论文提出了一种让机器人在人群中移动时更懂‘礼貌’的新方法,它先用传统技术规划几条可行的物理路线,然后借助一个经过专门训练的视觉语言模型,像人一样‘思考’哪条路线最符合社交礼仪,从而选出既安全又不打扰他人的最优路径。
OSCAR:用于组合图像检索的优化引导智能体规划框架 / OSCAR: Optimization-Steered Agentic Planning for Composed Image Retrieval
这篇论文提出了一个名为OSCAR的新框架,它将组合图像检索任务从一个依赖试错的启发式搜索过程,转变为一个有理论依据的轨迹优化问题,通过离线计算最优检索路径并在线引导模型,从而用更少的数据实现了更准确、泛化能力更强的检索效果。
Transformer的热力学同构:一种基于拉格朗日方法的注意力动力学研究 / Thermodynamic Isomorphism of Transformers: A Lagrangian Approach to Attention Dynamics
这篇论文首次从物理学的“最小作用量原理”出发,将Transformer模型中的注意力机制视为一个遵循热力学和信息动力学规律的系统,从而为人工智能的底层机制提供了一个统一的理论框架,并解释了模型训练中的涌现现象。
请先 登录 后再提交论文