arXiv最新AI论文速览速学

🔍

标签: #fine-tuning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: SplitFT: An Adaptive Federated Split Learning System For LLMs Fine-Tuning 04-30

arXiv ID: 2604.01496

arXiv 提交日期: 2026-04-02

llm agents model training software engineering agents fine-tuning code generation benchmark zero-shot transfer

从SWE-ZERO到SWE-HERO：面向软件工程智能体的从无执行到基于执行的微调方法 / From SWE-ZERO to SWE-HERO: Execution-free to Execution-based Fine-tuning for Software Engineering Agents

1️⃣ 一句话总结

这篇论文提出了一种两阶段微调方法，先让AI模型通过大量代码学习掌握语义理解，再通过实际执行反馈进行精准优化，从而打造出能高效解决真实软件工程问题的智能体，并在多个测试中取得了顶尖性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.23957

arXiv 提交日期: 2026-03-25

computer vision model training reinforcement learning point cloud few-shot learning fine-tuning 3d perception representation learning

PointRFT：面向点云少样本学习的显式强化微调方法 / PointRFT: Explicit Reinforcement Fine-tuning for Point Cloud Few-shot Learning

1️⃣ 一句话总结

这篇论文首次将强化学习引入3D点云模型的微调过程，通过设计专门的奖励机制，有效提升了模型在数据稀缺情况下的识别性能，尤其在少样本学习任务中表现优异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.24518

arXiv 提交日期: 2026-03-25

llm model training machine learning knowledge distillation fine-tuning model transfer parameter efficient fine-tuning synthetic data generation

TuneShift-KD：面向微调模型的知识蒸馏与迁移 / TuneShift-KD: Knowledge Distillation and Transfer for Fine-tuned Models

1️⃣ 一句话总结

这篇论文提出了一种名为TuneShift-KD的新方法，它能在不依赖原始专业数据的情况下，通过对比微调模型和基础模型的困惑度差异，自动识别并蒸馏出专业领域的知识，然后利用少量代表性提示生成合成数据集，从而将知识高效迁移到新的预训练模型中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.24023

arXiv 提交日期: 2026-03-25

llm natural language processing systems text-to-sql fine-tuning database schema model efficiency production deployment

内部化模式：一种用于大规模高效文本到SQL的两阶段微调方法 / Schema on the Inside: A Two-Phase Fine-Tuning Method for High-Efficiency Text-to-SQL at Scale

1️⃣ 一句话总结

本文提出了一种两阶段微调方法，训练出一个可内部化数据库结构的专用小模型，从而在文本转SQL任务中，用极低的本地计算成本替代昂贵的大模型API调用，实现了高精度、低延迟的大规模生产部署。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.24372

arXiv 提交日期: 2026-03-25

llm natural language processing model training autoformalization cycle consistency reinforcement learning fine-tuning mathematical reasoning

通过循环一致性微调改进Lean4自动形式化 / Improving Lean4 Autoformalization via Cycle Consistency Fine-tuning

1️⃣ 一句话总结

这篇论文通过一种名为‘循环一致性奖励’的强化学习方法，显著提升了AI将自然语言数学文本自动翻译成Lean4形式化证明语言的准确性和语义保持能力，比传统的监督学习方法效果更好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.23047

arXiv 提交日期: 2026-03-24

llm model training model evaluation retrieval-augmented generation fine-tuning knowledge internalization evaluation metrics electronic design automation

电子设计自动化中RAG微调的参数化知识与检索行为研究 / Parametric Knowledge and Retrieval Behavior in RAG Fine-Tuning for Electronic Design Automation

1️⃣ 一句话总结

这篇论文通过开发一种基于三元组的人工验证评估方法（TriFEX）和新的指标（PKP），揭示了在电子设计自动化任务中，传统评估指标无法有效检测RAG微调模型生成内容的真实性差异，并证明较小的模型经过适当微调后，可以在专业任务上达到甚至超过大模型的性能，从而实现更经济高效的本地部署。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.22186

arXiv 提交日期: 2026-03-23

llm natural language processing model training machine translation document-level translation data augmentation fine-tuning synthetic data

通过过滤合成语料库与两阶段大语言模型适配增强文档级机器翻译 / Enhancing Document-Level Machine Translation via Filtered Synthetic Corpora and Two-Stage LLM Adaptation

1️⃣ 一句话总结

这篇论文提出了一种两阶段微调方法，通过大语言模型生成并过滤出高质量的文档级翻译数据，以解决大语言模型在文档翻译中数据稀缺和容易产生幻觉或遗漏的问题，从而提升其翻译效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.21213

arXiv 提交日期: 2026-03-22

computer vision medical model training counterfactual image generation spatially localized synthesis fine-tuning segmentation guidance medical imaging

基于位置分割器引导的反事实微调用于空间局部化图像合成 / Positional Segmentor-Guided Counterfactual Fine-Tuning for Spatially Localized Image Synthesis

1️⃣ 一句话总结

这篇论文提出了一种新方法，能够对医学图像（如心脏血管CT）中的特定局部区域进行精细、逼真的修改，用于模拟疾病发展，解决了现有技术只能进行全局修改或需要繁琐人工标注的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.18991

arXiv 提交日期: 2026-03-19

model training aigc machine learning diffusion models fine-tuning preference alignment data efficiency reinforcement learning

CRAFT：对齐扩散模型的微调比你想象的更容易 / CRAFT: Aligning Diffusion Models with Fine-Tuning Is Easier Than You Think

1️⃣ 一句话总结

本文提出了一种名为CRAFT的新型微调方法，它通过一种复合奖励筛选技术，仅需少量高质量数据就能高效地让AI图像生成模型更好地符合人类偏好，并且训练速度远超现有主流方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.17390

arXiv 提交日期: 2026-03-18

computer vision model training multi-modal material classification vision-language models synthetic data generation auto-labeling fine-tuning

利用基础模型提升材料分类的准确性 / Harnessing the Power of Foundation Models for Accurate Material Classification

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过自动生成高质量训练数据和融合视觉语言模型的先验知识，有效解决了材料分类任务中数据稀缺的难题，显著提升了分类的准确性和泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.01496

1️⃣ 一句话总结

arXiv ID: 2603.23957

1️⃣ 一句话总结

arXiv ID: 2603.24518

1️⃣ 一句话总结

arXiv ID: 2603.24023

1️⃣ 一句话总结

arXiv ID: 2603.24372

1️⃣ 一句话总结

arXiv ID: 2603.23047

1️⃣ 一句话总结

arXiv ID: 2603.22186

1️⃣ 一句话总结

arXiv ID: 2603.21213

1️⃣ 一句话总结

arXiv ID: 2603.18991

1️⃣ 一句话总结

arXiv ID: 2603.17390

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.01496 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.23957 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.24518 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.24023 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.24372 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.23047 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.22186 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.21213 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.18991 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.17390 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.01496

arXiv ID: 2603.23957

arXiv ID: 2603.24518

arXiv ID: 2603.24023

arXiv ID: 2603.24372

arXiv ID: 2603.23047

arXiv ID: 2603.22186

arXiv ID: 2603.21213

arXiv ID: 2603.18991

arXiv ID: 2603.17390