arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media 05-02

arXiv ID: 2604.19254

arXiv 提交日期: 2026-04-21

llm model training systems parameter-efficient fine-tuning low-rank adaptation shadow network efficiency layer-space adaptation

ShadowPEFT：基于影子网络的参数高效微调方法 / ShadowPEFT: Shadow Network for Parameter-Efficient Fine-Tuning

1️⃣ 一句话总结

ShadowPEFT提出了一种新的参数高效微调框架，通过一个可跨层共享的“影子”模块来逐步优化每层的隐藏状态，从而取代传统方法中对每个权重单独添加低秩扰动的方式，在保持模型大部分参数冻结的同时，以更灵活、更集中的方式实现高效微调，并在多项任务上取得了与LoRA相当或更优的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19570

arXiv 提交日期: 2026-04-21

medical computer vision model training image segmentation rectified flow transformer efficient inference multi-scale

RF-HiT：用于通用医学图像分割的修正流层次化Transformer / RF-HiT: Rectified Flow Hierarchical Transformer for General Medical Image Segmentation

1️⃣ 一句话总结

本文提出了一种名为RF-HiT的高效医学图像分割模型，通过结合层次化Transformer和修正流技术，在保持低计算量和极少推理步数的同时，实现了与大型复杂模型相当的高精度分割性能，适合实时临床应用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19343

arXiv 提交日期: 2026-04-21

machine learning systems model training reservoir computing memristive devices time series neuromorphic efficient training

面向时间序列分类的可扩展忆阻友好型储层计算 / Scalable Memristive-Friendly Reservoir Computing for Time Series Classification

1️⃣ 一句话总结

本文提出了一种名为MARS的简化并行忆阻储层计算架构，通过创新的减法跳跃连接实现了高效并行计算和深层模型组合，相比传统轻量级回声状态网络训练速度提升21倍，并在多个长序列基准任务中显著超越了LRU、S5、Mamba等强梯度模型，将训练时间从分钟或小时级压缩到秒甚至百毫秒级，为构建兼具高预测性能与极致计算效率的类脑学习系统提供了可行路线。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19999

arXiv 提交日期: 2026-04-21

computer vision machine learning model training uav detection data augmentation lightweight model real-time context-aware

优化数据增强以实现实时小型无人机检测：一种轻量级上下文感知方法 / Optimizing Data Augmentation for Real-Time Small UAV Detection: A Lightweight Context-Aware Approach

1️⃣ 一句话总结

本文提出了一种轻量级且上下文感知的数据增强方法（结合Mosaic策略和HSV颜色调整），在不增加计算负担的前提下，显著提升了YOLOv11 Nano等小型模型对小型无人机的检测精度与抗干扰能力，避免了传统增强方法（如Copy-Paste）带来的伪影和过拟合问题，并在雾天等复杂环境下仍能保持稳健性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19716

arXiv 提交日期: 2026-04-21

llm model training model evaluation logical reasoning subspace alignment canonical correlation analysis multi-step reasoning steering

发现共享的逻辑子空间：通过自然语言与符号视图的对齐引导大模型逻辑推理 / Discovering a Shared Logical Subspace: Steering LLM Logical Reasoning via Alignment of Natural-Language and Symbolic Views

1️⃣ 一句话总结

本文发现大语言模型内部存在一个同时兼容自然语言和符号逻辑推理的共享子空间，并提出一种无需额外训练的方法，通过沿该子空间引导推理链，显著提升了模型在多步逻辑推理任务上的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19355

arXiv 提交日期: 2026-04-21

reinforcement learning systems model training active sensing field reconstruction latent world model pomdp sensor placement

LASER：面向连续场重建的学习型主动感知方法 / LASER: Learning Active Sensing for Continuum Field Reconstruction

1️⃣ 一句话总结

本文提出了一种名为LASER的闭环主动感知框架，通过将传感器移动决策建模为部分可观测马尔可夫决策过程，并利用隐空间世界模型预测物理场动态，使得传感器能自主移动到信息最丰富的区域，从而在传感器数量极少的情况下仍能高精度地重建连续物理场。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19587

arXiv 提交日期: 2026-04-21

computer vision model training multi-modal image editing reasoning-to-generation photographic enhancement reinforcement learning image quality

SmartPhotoCrafter：面向自动照片图像编辑的统一推理、生成与优化 / SmartPhotoCrafter: Unified Reasoning, Generation and Optimization for Automatic Photographic Image Editing

1️⃣ 一句话总结

本文提出了一种名为SmartPhotoCrafter的自动照片编辑方法，它像一位智能摄影师，先自动分析照片的不足之处，再针对性地进行修复和美化，无需用户提供任何专业指令，就能生成媲美专业后期效果的图片。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19157

arXiv 提交日期: 2026-04-21

llm systems model training kv-cache quantization system-aware inference serving compression

SAW-INT4：面向实际大语言模型服务的系统感知4位KV缓存量化 / SAW-INT4: System-Aware 4-Bit KV-Cache Quantization for Real-World LLM Serving

1️⃣ 一句话总结

本文提出了一种系统感知的4位KV缓存量化方法，通过简单的按Token量化和分块对角哈达玛旋转，在不牺牲服务效率的前提下，几乎恢复了朴素INT4量化带来的精度损失，并证明了在实际部署中轻量级方法比复杂方法更有效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19350

arXiv 提交日期: 2026-04-21

medical computer vision model training breast cancer mammogram vision transformer contrastive learning fine-grained classification

关注重点：利用视觉基础模型进行基于乳腺X光图像的乳腺癌分类 / Attend what matters: Leveraging vision foundational models for breast cancer classification using mammograms

1️⃣ 一句话总结

该论文提出了一种结合目标检测、对比学习和自监督视觉Transformer（DINOv2）的框架，通过减少无关图像区域、强化对相似病变的区分能力，有效提升了乳腺X光片中乳腺癌检测的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19233

arXiv 提交日期: 2026-04-21

computer vision model training small object detection adaptive slicing high-resolution imagery inference optimization aerial imagery

自适应切片辅助超推理：面向高分辨率影像中增强小目标检测的方法 / Adaptive Slicing-Assisted Hyper Inference for Enhanced Small Object Detection in High-Resolution Imagery

1️⃣ 一句话总结

本文提出一种自适应切片框架（ASAHI），能根据图像分辨率动态决定切片数量，在减少冗余计算的同时提升高分辨率遥感图像中小目标检测的精度和速度，并在两个公开数据集上取得最优结果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.19254

1️⃣ 一句话总结

arXiv ID: 2604.19570

1️⃣ 一句话总结

arXiv ID: 2604.19343

1️⃣ 一句话总结

arXiv ID: 2604.19999

1️⃣ 一句话总结

arXiv ID: 2604.19716

1️⃣ 一句话总结

arXiv ID: 2604.19355

1️⃣ 一句话总结

arXiv ID: 2604.19587

1️⃣ 一句话总结

arXiv ID: 2604.19157

1️⃣ 一句话总结

arXiv ID: 2604.19350

1️⃣ 一句话总结

arXiv ID: 2604.19233

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.19254 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19570 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19343 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19999 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19716 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19355 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19587 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19157 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19350 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19233 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.19254

arXiv ID: 2604.19570

arXiv ID: 2604.19343

arXiv ID: 2604.19999

arXiv ID: 2604.19716

arXiv ID: 2604.19355

arXiv ID: 2604.19587

arXiv ID: 2604.19157

arXiv ID: 2604.19350

arXiv ID: 2604.19233