arXiv最新AI论文速览速学

🔍

标签: #self-supervised learning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Physics-Driven Zero-Shot MRI Reconstruction with Non-local Image Priors 06-22

arXiv ID: 2606.18664

arXiv 提交日期: 2026-06-17

robotics audio machine learning sound source localization subspace estimation self-supervised learning robot audition doa estimation

NeuralMUSIC：一种用于机器人声源定位的混合神经子空间框架 / NeuralMUSIC: A Hybrid Neural-Subspace Framework for Robot Sound Source Localization

1️⃣ 一句话总结

本文提出了一种结合深度学习和经典MUSIC算法的混合框架，通过神经网络预测空间协方差矩阵并融合频率注意力机制，显著提升了机器人在噪声环境下声源定位的准确性和跨场景泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15110

arXiv 提交日期: 2026-06-13

medical machine learning model training mri reconstruction zero-shot self-supervised learning physics-driven

基于物理驱动的零样本磁共振图像重建与非局部图像先验 / Physics-Driven Zero-Shot MRI Reconstruction with Non-local Image Priors

1️⃣ 一句话总结

本文提出了一种零样本磁共振图像重建方法，通过结合物理一致性约束与图像中非局部相似性先验，在无需完整训练数据的情况下，显著提升了高加速因子下的重建质量，性能接近有监督方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05922

arXiv 提交日期: 2026-06-04

agents machine learning self-supervised learning trajectory optimization agent harness preference learning task adaptation

回溯性工具链优化：通过轨迹回滚的自我偏好提升智能体性能 / Retrospective Harness Optimization: Improving LLM Agents via Self-Preference over Trajectory Rollouts

1️⃣ 一句话总结

本文提出一种名为RHO的自我监督方法，让AI智能体从自己过去的任务轨迹中自动选择困难案例并重新尝试，通过自我验证和偏好比较来优化其技能与工具组合，无需人工标注数据，在软件工程等任务中可将成功率从59%提升至78%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05109

arXiv 提交日期: 2026-06-03

multi-modal model training machine learning disentangled representation multimodal learning scalable architecture self-supervised learning pairwise disentanglement

RePercENT：将解耦表示学习扩展到两种模态以上 / RePercENT: Scaling Disentangled Representation Learning Beyond Two Modalities

1️⃣ 一句话总结

本文提出了一种名为RePercENT的自监督框架，通过即插即用的架构和联合优化目标，能够高效地将多模态数据中的共享与独有特征分离开来，突破了现有方法只能处理两种模态的限制，极大降低了计算复杂度并保持优秀性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03148

arXiv 提交日期: 2026-06-02

computer vision model evaluation self-supervised learning vision transformers attention localization foreground object detection representation learning

A²：更小的自监督视觉Transformer比更大的模型定位更精准 / $A^2$: Smaller Self-Supervised ViTs Localize Better than Larger Ones

1️⃣ 一句话总结

这篇论文发现，在自监督预训练的视觉Transformer中，较小的模型生成的注意力图能更准确地定位图像中的主要物体，而较大的模型虽然能提取更丰富的特征但定位能力较差；因此，作者提出A²方法，通过用小模型定位物体并裁剪图像，再用大模型提取裁剪后的特征，从而兼具两者的优势，在不额外训练的情况下显著提升了分类鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28643

arXiv 提交日期: 2026-05-27

natural language processing graph machine learning character network dynamic graphs heterogeneous literary analysis self-supervised learning

GraphLit：面向文学研究的文本增强动态人物关系网络表示学习 / GraphLit: Learning Text-Enriched Dynamic Character Network Representations for Literary Study

1️⃣ 一句话总结

本文提出了一种名为GraphLit的自监督学习框架，能够将长篇小说中的角色及其对话文本动态组织成随时间变化的关系网络，从而在角色分类、关系预测等十二项任务上显著优于仅用文本或仅用图结构的方法，尤其擅长理解需要上下文分析的任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.26287

arXiv 提交日期: 2026-05-25

medical computer vision model training masked autoencoder multifractal analysis medical image classification masking strategy self-supervised learning

基于多重分形的掩码自编码器：在医学图像中的应用 / A multifractal-based masked auto-encoder: an application to medical images

1️⃣ 一句话总结

本文提出一种名为MO-MAE的新方法，通过使用多重分形分析（基于Renyi熵）来优化掩码自编码器的随机掩码策略，使其更关注医学图像中信息丰富且与诊断相关的复杂区域，从而在保持低计算开销的同时显著提升医学图像分类和特征重建的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21861

arXiv 提交日期: 2026-05-21

medical multi-modal model training modular representation foundation model self-supervised learning modality imbalance benchmark

多模态医学视觉基础模型中的涌现模块化表征学习 / Learning Emergent Modular Representations in Multi-modality Medical Vision Foundation Models

1️⃣ 一句话总结

本文提出一种名为Director-Experts（DEX）的新型模块化网络，通过让不同专家模块自动学习各自擅长处理一种医学影像模态的特征，再用一个“导演”模块将各专家知识融合到共享空间中，从而有效解决了多模态医学图像预训练中不同模态数据差异巨大导致的模型性能下降问题，并在涵盖10种模态、400万图像的数据集上验证了其优越性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21970

arXiv 提交日期: 2026-05-21

medical self-supervised learning computer vision medical image classification entropy-guided mae transfer learning ensemble convnext

基于熵引导自监督学习的医学图像分类 / Entropy-Guided Self-Supervised Learning for Medical Image Classification

1️⃣ 一句话总结

该论文提出了一种结合自监督学习和迁移学习的医学图像分类方法，通过一个在ImageNet上预训练的ConvNeXt-Tiny模型和一个在目标医学数据上通过熵引导掩码自编码器预训练的模型进行集成，在四个医学影像数据集上取得了优于现有方法的分类性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19982

arXiv 提交日期: 2026-05-19

computer vision machine learning low-light image enhancement retinex theory illumination priors self-supervised learning image restoration

InterLight：利用内在光照先验进行低光照图像增强 / InterLight: Leveraging Intrinsic Illumination Priors for Low-Light Image Enhancement

1️⃣ 一句话总结

本文提出了一种名为InterLight的框架，通过挖掘图像本身的光照特性（如传感器响应和场景亮度信息），设计了一种光照感知的增强流程，能更自然地改善低光照图像的清晰度和颜色，避免过度增强或失真。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.18664

1️⃣ 一句话总结

arXiv ID: 2606.15110

1️⃣ 一句话总结

arXiv ID: 2606.05922

1️⃣ 一句话总结

arXiv ID: 2606.05109

1️⃣ 一句话总结

arXiv ID: 2606.03148

1️⃣ 一句话总结

arXiv ID: 2605.28643

1️⃣ 一句话总结

arXiv ID: 2605.26287

1️⃣ 一句话总结

arXiv ID: 2605.21861

1️⃣ 一句话总结

arXiv ID: 2605.21970

1️⃣ 一句话总结

arXiv ID: 2605.19982

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.18664 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15110 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05922 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05109 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03148 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28643 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.26287 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21861 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21970 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19982 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.18664

arXiv ID: 2606.15110

arXiv ID: 2606.05922

arXiv ID: 2606.05109

arXiv ID: 2606.03148

arXiv ID: 2605.28643

arXiv ID: 2605.26287

arXiv ID: 2605.21861

arXiv ID: 2605.21970

arXiv ID: 2605.19982