← 返回列表

菜单

🤖 系统
📄 Abstract - LiveSecBench: A Dynamic Security Benchmark for Chinese LLM Applications
正在获取摘要...
顶级标签: llm
详细标签: safety evaluation chinese llm dynamic benchmark agent safety multi-modal security 或 搜索:

📄 论文总结

LiveSecBench:针对中文语言模型应用的动态安全基准 / LiveSecBench: A Dynamic Security Benchmark for Chinese LLM Applications


1️⃣ 一句话总结

LiveSecBench是一个专门针对中文语言、社会文化和法律框架设计的动态更新安全基准,通过六个维度评估大语言模型的安全性,并采用ELO评级系统进行模型排名。


2️⃣ 论文创新点

1. 动态更新机制

2. 文化相关性设计

3. 多维度安全评估框架

4. 文生图安全性评估

5. 智能体安全性评估


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF