arXiv最新AI论文速览速学

🔍

标签: #fine-tuning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 161 72小时内新更新论文 72h更新 166 最新: Fusian: Multi-LoRA Fusion for Fine-Grained Continuous MBTI Personality Control in Large Language Models 03-17

arXiv ID: 2602.21933

arXiv 提交日期: 2026-02-25

natural language processing llm model evaluation sarcasm detection code-mixed text hinglish fine-tuning low-resource nlp

小胜大：比较大语言模型与领域微调模型在混合印地-英语文本中的讽刺检测能力 / Small Wins Big: Comparing Large Language Models and Domain Fine-Tuned Models for Sarcasm Detection in Code-Mixed Hinglish Text

1️⃣ 一句话总结

这项研究发现，在资源有限的混合印地-英语文本讽刺检测任务中，经过针对性微调的小型模型（DistilBERT）表现优于多种通用大语言模型，表明特定领域的精细调整比模型规模本身更为关键。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19449

arXiv 提交日期: 2026-02-23

multi-modal model training machine learning vision-language models domain adaptation discrete representations fine-tuning codebook learning

解耦视觉与语言：基于码本锚定的视觉适配 / Decoupling Vision and Language: Codebook Anchored Visual Adaptation

1️⃣ 一句话总结

这篇论文提出了一种名为CRAFT的轻量级方法，通过使用一个离散码本将视觉表示锚定在稳定的符号空间中，从而让大型视觉语言模型在不修改其他部分的情况下，高效地适应医学图像诊断等特定领域任务，并显著提升其性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20089

arXiv 提交日期: 2026-02-23

multi-modal model training computer vision vision-language alignment cross-modal retrieval structural representation fine-tuning edge maps

StructXLIP：利用多模态结构线索增强视觉语言模型 / StructXLIP: Enhancing Vision-language Models with Multimodal Structural Cues

1️⃣ 一句话总结

这篇论文提出了一种名为StructXLIP的微调方法，通过提取并专门对齐图像边缘图和文本中的结构信息，显著提升了视觉语言模型在细节丰富的跨模态检索任务上的性能，使其学习到更鲁棒和语义稳定的特征。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17465

arXiv 提交日期: 2026-02-19

llm model training data data selection entropy fine-tuning uncertainty estimation computational efficiency

基于熵的语言模型数据选择方法 / Entropy-Based Data Selection for Language Models

1️⃣ 一句话总结

本文提出了一种基于熵的无监督数据选择框架，能在计算资源受限的情况下，高效筛选出高质量的训练数据，从而显著降低大语言模型微调所需的计算成本和数据量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16590

arXiv 提交日期: 2026-02-18

computer vision model training multi-modal contrastive learning image classification attention mechanism fine-tuning street-view

基于注意力特征自适应的对比学习框架在街景图像分类中的应用 / A Contrastive Learning Framework Empowered by Attention-based Feature Adaptation for Street-View Image Classification

1️⃣ 一句话总结

这篇论文提出了一种名为CLIP-MHAdapter的轻量级改进方法，通过在预训练视觉语言模型CLIP上添加一个带有多头自注意力机制的小型网络模块，使其能更有效地捕捉街景图像中细粒度的局部特征，从而以较低的算力成本在多个街景属性分类任务上取得了领先或具有竞争力的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15799

arXiv 提交日期: 2026-02-17

llm model training theory alignment collapse safety degradation fine-tuning geometric analysis gradient descent

对齐崩溃的几何学：当微调破坏安全性时 / The Geometry of Alignment Collapse: When Fine-Tuning Breaks Safety

1️⃣ 一句话总结

这篇论文发现，即使使用无害数据对已对齐的大语言模型进行微调，也会因为模型参数空间中安全对齐结构固有的几何脆弱性，导致安全护栏在训练过程中被系统地、不可预测地破坏，其根本原因在于梯度下降无法感知和避开高曲率的低维敏感子空间。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15620

arXiv 提交日期: 2026-02-17

llm reinforcement learning model training policy optimization training stability spurious tokens mathematical reasoning fine-tuning

STAPO：通过抑制罕见伪标记来稳定大语言模型的强化学习训练 / STAPO: Stabilizing Reinforcement Learning for LLMs by Silencing Rare Spurious Tokens

1️⃣ 一句话总结

这篇论文发现大语言模型强化学习训练不稳定的根源是极少数‘伪标记’，并提出了STAPO方法，通过选择性屏蔽这些标记的梯度更新，有效提升了训练稳定性和模型在数学推理任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14462

arXiv 提交日期: 2026-02-16

model training machine learning systems distributed training fine-tuning optimization dynamics gradient consistency diagnostic framework

数据并行全参数微调中的静默不一致性：诊断工作节点级优化失准 / Silent Inconsistency in Data-Parallel Full Fine-Tuning: Diagnosing Worker-Level Optimization Misalignment

1️⃣ 一句话总结

这篇论文发现，在大语言模型的数据并行全参数微调中，即使模型参数在每次迭代后通过同步保持一致，各个计算节点内部的实际优化过程也可能存在隐藏的不一致，并提出了一个轻量级的诊断框架来量化这种‘静默不一致性’，帮助更可靠地评估训练稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14432

arXiv 提交日期: 2026-02-16

model training machine learning theory model quantization activation outliers spectral regularization transformer models fine-tuning

S2D：用于神经激活量化友好调节的选择性谱衰减 / S2D: Selective Spectral Decay for Quantization-Friendly Conditioning of Neural Activations

1️⃣ 一句话总结

这篇论文提出了一种名为S2D的新方法，通过有针对性地调整神经网络权重中影响最大的部分，有效解决了大模型量化时因激活值异常大而导致的精度下降问题，从而让模型在保持高性能的同时更容易被压缩和高效部署。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.12002

arXiv 提交日期: 2026-02-12

computer vision medical multi-modal activity recognition vision-language models newborn resuscitation fine-tuning video analysis

本地视觉语言模型能否超越视觉Transformer提升活动识别能力？——以新生儿复苏为例的研究 / Can Local Vision-Language Models improve Activity Recognition over Vision Transformers? -- Case Study on Newborn Resuscitation

1️⃣ 一句话总结

这项研究发现，通过LoRA方法微调的小型本地视觉语言模型，在识别新生儿复苏视频中的精细活动时，其准确性可以显著超越传统的视觉Transformer模型，为解决临床实践中的活动记录难题提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.21933

1️⃣ 一句话总结

arXiv ID: 2602.19449

1️⃣ 一句话总结

arXiv ID: 2602.20089

1️⃣ 一句话总结

arXiv ID: 2602.17465

1️⃣ 一句话总结

arXiv ID: 2602.16590

1️⃣ 一句话总结

arXiv ID: 2602.15799

1️⃣ 一句话总结

arXiv ID: 2602.15620

1️⃣ 一句话总结

arXiv ID: 2602.14462

1️⃣ 一句话总结

arXiv ID: 2602.14432

1️⃣ 一句话总结

arXiv ID: 2602.12002

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.21933 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19449 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20089 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17465 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16590 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15799 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15620 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14462 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14432 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.12002 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.21933

arXiv ID: 2602.19449

arXiv ID: 2602.20089

arXiv ID: 2602.17465

arXiv ID: 2602.16590

arXiv ID: 2602.15799

arXiv ID: 2602.15620

arXiv ID: 2602.14462

arXiv ID: 2602.14432

arXiv ID: 2602.12002