arXiv最新AI论文速览速学

🔍

标签: #zero-shot ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Physics-Driven Zero-Shot MRI Reconstruction with Non-local Image Priors 06-22

arXiv ID: 2606.18709

arXiv 提交日期: 2026-06-17

llm model evaluation natural language processing item discrimination psychometric evaluation reading comprehension educational assessment zero-shot

大语言模型难以衡量能区分不同熟练水平学生的试题特性——阅读理解评估中题目区分度的研究 / LLMs Struggle to Measure What Distinguishes Students of Different Proficiency Levels: A Study of Item Discrimination in Reading Comprehension Assessment

1️⃣ 一句话总结

这项研究测试了42种大语言模型，发现它们无法准确判断考试题目能否有效区分高低水平学生：直接预测题目区分度时效果很差，而通过模拟学生答题来计算区分度也只能提供有限参考，表明当前AI在评估测验质量方面还存在明显短板。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15110

arXiv 提交日期: 2026-06-13

medical machine learning model training mri reconstruction zero-shot self-supervised learning physics-driven

基于物理驱动的零样本磁共振图像重建与非局部图像先验 / Physics-Driven Zero-Shot MRI Reconstruction with Non-local Image Priors

1️⃣ 一句话总结

本文提出了一种零样本磁共振图像重建方法，通过结合物理一致性约束与图像中非局部相似性先验，在无需完整训练数据的情况下，显著提升了高加速因子下的重建质量，性能接近有监督方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09142

arXiv 提交日期: 2026-06-08

computer vision multi-modal model training egocentric vision pedestrian intent vision language model fine-tuning zero-shot

通过视觉语言模型从第一人称视角解码行人过街意图 / Decoding Pedestrian Crossing Intention from Egocentric Vision via Vision Language Models

1️⃣ 一句话总结

本研究利用视觉语言模型分析第一人称视角的短视频，通过将其转化为问答任务来预测行人是否要过马路，并发现微调后的模型比零样本方法和传统模型更准确，结合自身运动、车辆运动和视线等额外信息后，准确率可提升14.5%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03509

arXiv 提交日期: 2026-06-02

robotics agents computer vision embodied navigation memory graph zero-shot visual-language model hierarchical planning

EvoMemNav：面向零样本具身导航的高效自进化细粒度记忆框架 / EvoMemNav: Efficient Self-Evolving Fine-Grained Memory for Zero-Shot Embodied Navigation

1️⃣ 一句话总结

本文提出了一种名为EvoMemNav的新方法，通过构建视觉-语义记忆图，让机器人在未经过专门训练的情况下，高效地记住并利用细粒度的视觉信息，从而在复杂环境中更准确地找到目标物体，解决了现有方法记忆粗糙或计算量过大的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.29188

arXiv 提交日期: 2026-05-27

natural language processing llm benchmark social science measurement diagnostics speech analysis zero-shot

口号还是立场？——面向中国国企演讲的创业精神话语测量的轻标签诊断方法 / Slogans or Stance? A Label-Light Diagnostic for Entrepreneurial-Discourse Measurement on Chinese SOE Speeches

1️⃣ 一句话总结

这篇论文提出了一种不需要大量人工标注的诊断方法，用于评估不同文本分析工具（如主题模型、词典法和大型语言模型）在测量国企领导讲话中“创业精神”时的有效性，发现大型语言模型表现最好，但其部分效果可能源于领导个人语言风格而非真正的创业立场。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28711

arXiv 提交日期: 2026-05-27

machine learning computer vision diffusion models inverse problems distortion-perception tradeoff zero-shot posterior sampling

扩散模型零样本逆问题中的逐阶段失真-感知遍历 / Stage-wise Distortion-Perception Traversal in Zero-shot Inverse Problems with Diffusion Models

1️⃣ 一句话总结

本文提出了一种名为MAP-RPS的两阶段方法，利用单一的扩散模型在图像修复等逆问题中实现失真与感知质量之间的灵活平衡，并进一步将其扩展到潜在空间以提升适用性和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.26857

arXiv 提交日期: 2026-05-26

machine learning data anomaly detection graph anomaly detection unsupervised learning knowledge distillation zero-shot prototype learning

基于原型蒸馏的通才图异常检测 / Generalist Graph Anomaly Detection via Prototype-Based Distillation

1️⃣ 一句话总结

本文提出了一种名为ProMoS的无监督图异常检测框架，它通过从预训练模型中提取正常数据的共同规律，并利用原型空间的知识对齐，实现了无需标注数据即可在全新图上零样本发现异常，解决了传统方法依赖昂贵标注和泛化性差的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21261

arXiv 提交日期: 2026-05-20

multi-modal retrieval zero-shot composed image retrieval semantic transition llm collaboration set-to-set alignment

STiTch：面向零样本组合图像检索的无训练协作语义过渡与传输框架 / STiTch: Semantic Transition and Transportation in Collaboration for Training-Free Zero-Shot Composed Image Retrieval

1️⃣ 一句话总结

本文提出了一种无需训练的零样本组合图像检索方法，通过语义过渡向量精炼文本描述，并利用双向传输距离实现图文之间的细粒度对齐，有效解决了现有方法中文本描述不准确和检索匹配粗糙的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.17907

arXiv 提交日期: 2026-05-18

multi-modal agents systems collaborative perception feature translation zero-shot heterogeneous modalities autonomous driving

一个模型翻译所有：面向异构协同感知的通用任意到任意翻译 / One Model to Translate Them All: Universal Any-to-Any Translation for Heterogeneous Collaborative Perception

1️⃣ 一句话总结

本文提出了一种名为UniTrans的通用模型，能零成本地将任意来源的感知特征自动翻译成目标格式，无需针对不同设备或厂商重复训练，从而解决了自动驾驶中多车协同感知时特征类型不匹配的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.14963

arXiv 提交日期: 2026-05-14

computer vision data model training stereo matching omnidirectional zero-shot normal priors synthetic dataset

H-OmniStereo：基于航向对齐法线先验的零样本全向立体匹配 / H-OmniStereo: Zero-Shot Omnidirectional Stereo Matching with Heading-Aligned Normal Priors

1️⃣ 一句话总结

本文提出一个零样本全向立体匹配框架，通过构建280万对合成全向立体图和创新的航向对齐法线估计器，克服了真实数据稀缺和球面畸变问题，使现有模型无需微调即可直接泛化到真实场景，实现了更高精度的360度深度感知。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.18709

1️⃣ 一句话总结

arXiv ID: 2606.15110

1️⃣ 一句话总结

arXiv ID: 2606.09142

1️⃣ 一句话总结

arXiv ID: 2606.03509

1️⃣ 一句话总结

arXiv ID: 2605.29188

1️⃣ 一句话总结

arXiv ID: 2605.28711

1️⃣ 一句话总结

arXiv ID: 2605.26857

1️⃣ 一句话总结

arXiv ID: 2605.21261

1️⃣ 一句话总结

arXiv ID: 2605.17907

1️⃣ 一句话总结

arXiv ID: 2605.14963

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.18709 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15110 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09142 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03509 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.29188 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28711 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.26857 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21261 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.17907 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.14963 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.18709

arXiv ID: 2606.15110

arXiv ID: 2606.09142

arXiv ID: 2606.03509

arXiv ID: 2605.29188

arXiv ID: 2605.28711

arXiv ID: 2605.26857

arXiv ID: 2605.21261

arXiv ID: 2605.17907

arXiv ID: 2605.14963