📄 论文总结
- 中英文论文题目:
CoTox: Chain-of-Thought Enhanced Large Language Models for Interpretable and Context-Aware Drug Toxicity Prediction
CoTox:基于链式思维增强的大语言模型用于可解释且上下文感知的药物毒性预测
1️⃣ 一句话总结
这篇论文提出了CoTox框架,通过结合链式思维(CoT)推理和多模态数据(化学结构、生物通路、基因本体术语),显著提升了药物毒性预测的准确性和可解释性,解决了传统方法依赖标注数据、缺乏生物上下文整合和可解释性不足的问题。
2️⃣ 论文创新点
1. 多模态输入整合与IUPAC命名优化
- 创新点:首次将IUPAC命名(替代传统SMILES)与生物通路、基因本体(GO)术语结合,作为多模态输入。
- 改进:IUPAC的语义丰富性和自然语言对齐特性更适配LLM的理解能力,解决了SMILES语法复杂、难以解析的问题。
- 意义:显著提升了模型对分子结构和毒性机制的解析能力,为化学输入格式提供了新实践标准。
2. 链式思维(CoT)驱动的结构化推理
- 创新点:设计分步推理机制(通路关联性、GO术语解析、结构特征推断、综合解释),生成标准化、可解释的毒性预测。
- 改进:相比传统零样本或少样本提示,CoTox通过结构化提示(如JSON格式)强制模型分步推理,避免黑箱预测。
- 意义:首次在毒性预测中实现“白盒”AI,为药物开发提供可追溯的生物学机制解释。
3. 动态生物上下文整合
- 创新点:利用细胞系基因表达数据(如L1000)和GSEA分析动态提取通路/GO术语,弥补新化合物缺乏数据库注释的局限。
- 改进:传统方法依赖静态数据库,而CoTox通过实验数据生成实时生物学术语,增强预测的生理相关性。
- 意义:扩展了框架对新药和罕见化合物的适用性,尤其在早期毒性风险评估中展现前瞻性(如Entecavir肾毒性案例)。
4. 混合模型性能优化
- 创新点:发现推理型LLMs(如GPT-4o、Gemini-2.5-Pro)在结合生物信息后性能提升显著(F1-score提升0.25+)。
- 改进:专家模型(如TxGemma)因缺乏生物信息处理能力表现较差,而CoTox通过通用LLM实现跨领域适配。
- 意义:为LLM在专业领域的微调策略提供新方向,平衡通用性与专业性。
3️⃣ 主要结果与价值
实验结果亮点
- 性能提升:CoTox在UniTox数据集上平均F1-score达0.663,比传统方法(XGBoost/Chemprop)和零样本提示提升超过25%。
- 关键毒性类型:对血液和肝脏毒性的预测效果最佳(F1-score >0.7),生物信息整合对这类毒性机制解析至关重要。
- 输入格式对比:IUPAC命名比SMILES平均提升15%性能,验证了自然语言对齐的优势。
实际应用价值
- 药物开发:可解释的毒性机制(如CYP2E1代谢、p53介导的DNA损伤响应)加速药物安全性评估,减少临床失败风险。
- 监管科学:案例中CoTox对Entecavir肾毒性的预测与后续临床发现一致,展现其在补充监管标签中的潜力。
- 跨领域扩展:框架可适配其他分子性质预测任务(如药效、代谢稳定性),方法论具有通用性。
4️⃣ 术语表
- CoTox:论文提出的毒性预测框架,整合链式思维推理与多模态生物化学数据。
- IUPAC:国际纯化学与应用化学联合会命名法,用于标准化分子结构的自然语言描述(替代SMILES)。
- GSEA(Gene Set Enrichment Analysis):基因集富集分析,从基因表达数据中提取显著性通路/功能术语。
- CTD(Comparative Toxicogenomics Database):提供化学物质与基因、通路关联的公共数据库。
- UniTox:基于GPT-4o构建的毒性预测数据集,覆盖六种毒性类型的二元/三元标签。
- LLM(Large Language Model):大语言模型,如GPT-4o、Gemini-2.5-Pro等核心推理引擎。
(总结已合并重复术语,忽略非核心缩写如SMILES/DILI,确保跨学科读者清晰理解。)