arXiv最新AI论文速览速学

🔍

标签: #fine-tuning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 161 72小时内新更新论文 72h更新 166 最新: Fusian: Multi-LoRA Fusion for Fine-Grained Continuous MBTI Personality Control in Large Language Models 03-17

arXiv ID: 2603.15405

arXiv 提交日期: 2026-03-16

llm model training natural language processing personality control lora fusion continuous traits reinforcement learning fine-tuning

Fusian：基于多LoRA融合的大语言模型细粒度连续MBTI人格控制 / Fusian: Multi-LoRA Fusion for Fine-Grained Continuous MBTI Personality Control in Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为Fusian的新方法，它通过融合多个微调模块并利用强化学习动态调整它们的组合权重，从而让大语言模型能够像调节音量旋钮一样，精确、连续地控制输出内容所体现的人格特质强度，而不仅仅是简单的类型切换。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15187

arXiv 提交日期: 2026-03-16

llm natural language processing model evaluation dialectal fairness evaluation data scarcity fine-tuning human-llm agreement

AI的探索：如何提升英语方言的公平性 / The Hrunting of AI: Where and How to Improve English Dialectal Fairness

1️⃣ 一句话总结

这篇论文发现，由于使用人数少、数据稀缺，大语言模型在少数英语方言上表现不佳，而且改进起来很困难，因为人类对这些方言的评判标准本身就存在分歧，导致模型难以学习；不过研究也发现，某些模型能生成高质量的方言数据，这为未来的改进提供了可能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09595

arXiv 提交日期: 2026-03-10

natural language processing model training model evaluation fine-tuning domain adaptation political science conflict classification bert models

构建、借用还是微调？政治科学家选择NLP模型的指南 / Build, Borrow, or Just Fine-Tune? A Political Scientist's Guide to Choosing NLP Models

1️⃣ 一句话总结

这篇论文通过比较在冲突事件分类任务中微调通用模型与使用领域专用模型的性能差异，为政治科学家提供了一个实用的决策框架，指出模型选择的关键取决于任务中事件类别的常见程度、对错误的容忍度以及可用资源，而非抽象的性能优劣。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08647

arXiv 提交日期: 2026-03-09

model training machine learning llm fine-tuning catastrophic forgetting parameter expansion plasticity stability trade-off transformer adaptation

增长而非覆盖：实现无遗忘的模型微调 / Grow, Don't Overwrite: Fine-tuning Without Forgetting

1️⃣ 一句话总结

这篇论文提出了一种创新的模型微调方法，通过复制并扩展预训练模型的内部结构来学习新任务，从而在保持原有能力不丢失的同时，达到与完全微调相当的新任务性能，且计算成本更低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03995

arXiv 提交日期: 2026-03-04

model training llm machine learning lora fine-tuning singular value decomposition parameter efficiency post-hoc refinement

谱手术：通过梯度引导的奇异值重加权实现无需训练的LoRA微调 / Spectral Surgery: Training-Free Refinement of LoRA via Gradient-Guided Singular Value Reweighting

1️⃣ 一句话总结

这篇论文提出了一种名为‘谱手术’的新方法，它能在不重新训练的情况下，通过分析并调整现有LoRA适配器中各个成分的重要性，来显著提升大语言模型在特定任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02873

arXiv 提交日期: 2026-03-03

llm natural language processing systems scientific writing document compilation structured editor information entropy fine-tuning

LaTeX编译：大语言模型时代的挑战 / LaTeX Compilation: Challenges in the Era of LLMs

1️⃣ 一句话总结

这篇论文指出，在大语言模型辅助科学写作的时代，传统的LaTeX格式在编译效率、错误定位和AI训练成本上存在明显缺陷，并提出一种名为Mogan STEM的新型所见即所得编辑器，其文档格式能显著提升编译速度和降低AI模型训练成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02840

arXiv 提交日期: 2026-03-03

model training machine learning data time series foundation models fine-tuning zero-shot forecasting data mixtures domain adaptation

通过数据混合适配时间序列基础模型 / Adapting Time Series Foundation Models through Data Mixtures

1️⃣ 一句话总结

这篇论文提出了一种名为MixFT的新方法，它通过智能地重新划分和混合数据来微调时间序列基础模型，从而比传统方法更能让模型适应新领域中的不同数据模式，最终提升其在零样本预测任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02908

arXiv 提交日期: 2026-03-03

llm model training model evaluation transferability sparse autoencoder interpretability fine-tuning feature analysis

SAE作为水晶球：无需训练，利用可解释特征预测大语言模型的跨领域可迁移性 / SAE as a Crystal Ball: Interpretable Features Predict Cross-domain Transferability of LLMs without Training

1️⃣ 一句话总结

这篇论文提出了一种名为STS的新方法，它利用稀疏自编码器分析大语言模型内部特征的变化，能够在模型进行下游任务微调之前，就准确预测其在不同领域应用中的表现好坏，为模型优化提供了可解释的指导工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02775

arXiv 提交日期: 2026-03-03

llm benchmark model evaluation mathematical tutoring pedagogical evaluation multi-turn dialogue fine-tuning educational ai

从解题者到辅导者：使用KMP-Bench评估大语言模型的教学智能 / From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

1️⃣ 一句话总结

这篇论文提出了一个名为KMP-Bench的综合性评估基准，专门用于测试大语言模型在K-8年级数学辅导中的教学能力，发现当前模型虽然擅长解题，但在遵循教学原则（如引导、解释、反馈）方面仍有不足，并证明使用高质量教学对话数据训练可以显著提升模型的辅导效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01223

arXiv 提交日期: 2026-03-01

reinforcement learning llm model training mathematical reasoning reward sparsity fine-tuning reference-guided learning rl training

通过参考引导微调在强化学习中学习难题 / Learn Hard Problems During RL with Reference Guided Fine-tuning

1️⃣ 一句话总结

这篇论文提出了一种名为ReGFT的新方法，它巧妙地利用人类编写的参考答案来引导大语言模型自己生成解题思路，从而解决了数学推理强化学习中因奖励稀疏而难以训练的问题，最终显著提升了模型在复杂数学问题上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.15405

1️⃣ 一句话总结

arXiv ID: 2603.15187

1️⃣ 一句话总结

arXiv ID: 2603.09595

1️⃣ 一句话总结

arXiv ID: 2603.08647

1️⃣ 一句话总结

arXiv ID: 2603.03995

1️⃣ 一句话总结

arXiv ID: 2603.02873

1️⃣ 一句话总结

arXiv ID: 2603.02840

1️⃣ 一句话总结

arXiv ID: 2603.02908

1️⃣ 一句话总结

arXiv ID: 2603.02775

1️⃣ 一句话总结

arXiv ID: 2603.01223

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.15405 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15187 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09595 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08647 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03995 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02873 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02840 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02908 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02775 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01223 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.15405

arXiv ID: 2603.15187

arXiv ID: 2603.09595

arXiv ID: 2603.08647

arXiv ID: 2603.03995

arXiv ID: 2603.02873

arXiv ID: 2603.02840

arXiv ID: 2603.02908

arXiv ID: 2603.02775

arXiv ID: 2603.01223