arXiv ID:
2601.17789
arXiv 提交日期: 2026-01-25
大语言模型指令遵循的神经符号验证 / Neuro-Symbolic Verification on Instruction Following of LLMs
1️⃣ 一句话总结
这篇论文提出了一个名为NSVIF的通用验证框架,它通过将用户指令建模为约束条件,并融合逻辑推理与语义分析,来检测大语言模型的输出是否遵循了指令,从而帮助提升模型的安全性和可靠性。