arXiv ID:
2605.21177
arXiv 提交日期: 2026-05-20
ChunkFT:面向内存高效全参数微调的字节流优化方法 / ChunkFT: Byte-Streamed Optimization for Memory-Efficient Full Fine-Tuning
1️⃣ 一句话总结
ChunkFT提出了一种创新的微调框架,通过动态激活工作集来分块计算梯度,无需修改网络结构即可大幅降低内存占用,使得在单张消费级显卡上也能完成70亿参数大模型的完整微调,并保持甚至超越传统全参数微调的性能。