arXiv ID:
2605.05159
arXiv 提交日期: 2026-05-06
基于集成Gemma模型与合成数据增强的多语言极化检测 / PSK at SemEval-2026 Task 9: Multilingual Polarization Detection Using Ensemble Gemma Models with Synthetic Data Augmentation
1️⃣ 一句话总结
本文针对涵盖22种语言的社交媒体极化检测任务,通过为每种语言单独微调Gemma大模型,并利用GPT-4o生成高质量合成数据来扩充训练集,最终采用集成策略取得了总成绩第二名,证明了针对不同语言进行个性化调整和合成数据增强的有效性。