← 返回列表

菜单

🤖 系统
📄 Abstract - Test-Time Self-Improvement: Dynamic Adaptation and Optimization for Large Language Models
正在获取摘要...
顶级标签: llm
详细标签: test-time adaptation uncertainty estimation online fine-tuning data synthesis self-improvement 或 搜索:

📄 论文总结

测试时自改进方法:大语言模型的动态适应与优化 / Test-Time Self-Improvement: Dynamic Adaptation and Optimization for Large Language Models


1️⃣ 一句话总结

本文提出了一种测试时自改进方法,通过识别模型不确定样本、生成相似训练数据并进行在线微调,实现在推理阶段动态提升模型性能,仅需少量样本即可显著提高准确率和泛化能力。


2️⃣ 论文创新点

1. 测试时自改进框架

2. 不确定性过滤机制

3. 即时数据合成

4. 分布锐化机制


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF