← 返回列表

菜单

🤖 系统
📄 Abstract - TiKMiX: Dynamic Data Mixing Optimization Framework for Language Model Pre-training Based on Group Influence Metric
正在获取摘要...
顶级标签: llm
详细标签: data mixing optimization group influence metric dynamic data selection pre-training efficiency gradient-based evaluation 或 搜索:

📄 论文总结

TiKMiX:基于组影响指标的语言模型预训练动态数据混合优化框架

TiKMiX: Dynamic Data Mixing Optimization Framework for Language Model Pre-training Based on Group Influence Metric


1️⃣ 一句话总结

TiKMiX是一种创新的动态数据混合优化框架,通过引入Group Influence指标高效评估不同数据域对模型性能的影响,并基于模型训练过程中的动态偏好调整数据混合比例,在计算资源减少80%的情况下显著提升模型在下游任务上的性能。


2️⃣ 论文创新点

1. Group Influence指标

2. TiKMiX动态数据混合框架

3. TiKMiX-D直接优化方法

4. TiKMiX-M回归预测方法


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF