arXiv ID:
2606.02536
追踪自适应智能体的行为轨迹 / Tracking the Behavioral Trajectories of Adapting Agents
1️⃣ 一句话总结
本文提出了一种通过分析智能体技能文件的文本变化来量化其行为特质的方法,例如判断智能体是否更倾向于获取敏感数据,从而实现对其行为演变的追踪与评估。
追踪自适应智能体的行为轨迹 / Tracking the Behavioral Trajectories of Adapting Agents
本文提出了一种通过分析智能体技能文件的文本变化来量化其行为特质的方法,例如判断智能体是否更倾向于获取敏感数据,从而实现对其行为演变的追踪与评估。
双语模型中的跨语言迁移是否类人?一项关于荷兰语和英语中重叠词形的研究 / Is Cross-Lingual Transfer in Bilingual Models Human-Like? A Study with Overlapping Word Forms in Dutch and English
这项研究发现,双语语言模型虽然能模拟人类双语阅读中的跨语言激活效应,但其与人类处理模式的匹配程度高度依赖于词汇重叠的编码方式,特别是只有当同源词共享词嵌入时,模型才能复现人类阅读中‘朋友词’促进而‘假朋友词’干扰的典型模式。
论医学视觉-语言嵌入中的锥体效应与模态鸿沟 / On the Cone Effect and Modality Gap in Medical Vision-Language Embeddings
这篇论文研究发现,在医学视觉-语言模型中,图像和文本特征之间的差异(模态鸿沟)并非越小越好,通过一个简单方法调节这个差异的大小,可以找到最适合具体医学任务的最佳状态,从而提升模型性能。
VERSE:视觉嵌入降维与空间探索——基于聚类指导的训练数据增强方法,用于富视觉文档理解 / VERSE: Visual Embedding Reduction and Space Exploration. Clustering-Guided Insights for Training Data Enhancement in Visually-Rich Document Understanding
这篇论文提出了一个名为VERSE的方法,它通过分析和可视化视觉语言模型的内部表示,找出模型容易出错的区域,并据此生成针对性的合成数据来增强训练,从而显著提升模型在富视觉文档理解任务上的性能,甚至能让本地模型媲美云端商业模型。
可解释嵌入与稀疏自编码器:一种数据分析工具包 / Interpretable Embeddings with Sparse Autoencoders: A Data Analysis Toolkit
这篇论文提出了一种使用稀疏自编码器生成可解释嵌入的新方法,相比传统的大语言模型和密集嵌入,它能以更低的成本、更高的可控性和可靠性,帮助研究人员分析大规模文本数据,从而发现数据集差异、模型偏见和隐藏概念关联。
嵌入空间中的信息丢失:视觉语言模型中的信息损失研究 / Lost in Embeddings: Information Loss in Vision-Language Models
这篇论文发现视觉语言模型在将图像信息投影到语言嵌入空间时会丢失大量关键信息,导致模型在图像检索和视觉问答任务中表现变差,并提出了两种方法来量化和定位这种信息损失。
请先 登录 后再提交论文