← 返回列表

菜单

🤖 系统
📄 Abstract - TOKDRIFT: Quantifying Code Large Language Models' Sensitivity to Tokenization Drift
正在获取摘要...
顶级标签: llm
详细标签: tokenization drift code llm robustness evaluation semantic preserving rewrite programming language 或 搜索:

📄 论文总结

TOKDRIFT:量化代码大语言模型对分词漂移的敏感性 / TOKDRIFT: Quantifying Code Large Language Models' Sensitivity to Tokenization Drift


1️⃣ 一句话总结

本研究提出TOKDRIFT框架,发现即使微小的代码格式变化也会导致代码大语言模型性能显著下降,揭示了子词分词与编程语言语法不对齐的根本问题。


2️⃣ 论文创新点

1. TOKDRIFT评估框架

2. 敏感性度量指标

3. 多维度实验设计


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF