arXiv最新AI论文速览速学

🔍

model evaluation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 139 72小时内新更新论文 72h更新 234 最新: HalDec-Bench: Benchmarking Hallucination Detector in Image Captioning 03-18

arXiv ID: 2603.10413

arXiv 提交日期: 2026-03-11

machine learning systems model evaluation network security adversarial attacks intrusion detection ensemble learning adversarial training

增强网络入侵检测系统：一种减轻对抗性攻击的多层集成方法 / Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

1️⃣ 一句话总结

这篇论文提出了一种结合堆叠分类器和自编码器的双层防御机制，并通过对抗性训练，有效提升了基于机器学习的网络入侵检测系统抵御对抗性攻击的鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10963

arXiv 提交日期: 2026-03-11

computer vision model training model evaluation point cloud transformer lightweight architecture foundation models benchmarking

Pointy - 一种用于点云基础模型的轻量级Transformer / Pointy - A Lightweight Transformer for Point Cloud Foundation Models

1️⃣ 一句话总结

这篇论文提出了一种名为Pointy的轻量级Transformer架构，它仅使用少量点云数据进行训练，就能在性能上超越许多使用海量多模态数据训练的大型基础模型，证明了精心设计的模型架构和训练方案比单纯堆砌数据规模更为有效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11001

arXiv 提交日期: 2026-03-11

model evaluation agents systems human uplift studies randomized controlled trials ai evaluation causal inference frontier ai

随机对照试验与人类提升研究：前沿人工智能评估的方法论挑战与实践解决方案 / RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

1️⃣ 一句话总结

这篇论文指出，尽管随机对照试验被广泛用于评估前沿AI对人类表现的影响，但由于AI系统快速演变、用户能力差异大等特性，传统因果推断的假设在实际应用中面临严峻挑战，作者通过访谈专家总结了这些挑战及应对方案，以明确此类证据在高风险决策中的适用边界。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10442

arXiv 提交日期: 2026-03-11

machine learning model training model evaluation gaussian processes conditional density estimation multimodal regression heteroscedastic nonparametric

广义高斯混合过程 / GGMPs: Generalized Gaussian Mixture Processes

1️⃣ 一句话总结

这篇论文提出了一种名为GGMP的新方法，它基于高斯过程，能够有效预测具有多个峰值、不确定性变化和非高斯特征的复杂数据分布，解决了传统方法只能预测单一、简单分布的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11027

arXiv 提交日期: 2026-03-11

llm model evaluation natural language processing llm-as-a-judge evaluation illusion rubric generation inter-evaluator agreement knowledge-grounded evaluation

超越共识的幻象：从表面启发式到基于知识的评估——论大语言模型作为评判者 / Beyond the Illusion of Consensus: From Surface Heuristics to Knowledge-Grounded Evaluation in LLM-as-a-Judge

1️⃣ 一句话总结

这篇论文挑战了‘大语言模型作为评判者时，评判结果高度一致就代表评估可靠’的普遍假设，指出这种共识常是假象，并提出了一个基于领域知识动态生成评估标准的新方法，能让评估在客观领域更一致、在主观领域更真实地反映多元观点。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10725

arXiv 提交日期: 2026-03-11

audio natural language processing model evaluation speech deepfake detection large audio language models chain-of-thought interpretability generalization

迈向基于类人推理的鲁棒语音深度伪造检测 / Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

1️⃣ 一句话总结

这篇论文提出了一种结合大型音频语言模型和类人思维链推理的新框架，不仅能更有效地检测不同来源的伪造语音，还能为判断结果提供易于人类理解的解释。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09772

arXiv 提交日期: 2026-03-10

machine learning model evaluation theory backdoor attacks adversarial robustness representation space neural network security feature space

移除触发器而非后门：替代触发器与潜在后门 / Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors

1️⃣ 一句话总结

这篇论文挑战了传统观点，指出仅移除已知的后门触发器无法真正消除AI模型中的后门，因为存在多种感知上不同的替代触发器也能激活同一个后门，因此防御措施应针对特征空间中的后门方向，而非仅仅处理输入层面的触发器。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10091

arXiv 提交日期: 2026-03-10

llm model evaluation agents jailbreak attack safety alignment adversarial attack reasoning vulnerabilities multi-task interference

多流扰动攻击：通过并发任务干扰打破思维型大语言模型的安全对齐 / Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

1️⃣ 一句话总结

这篇论文发现，让大语言模型同时处理多个交织的任务（比如把不同问题混在一起问）可以干扰其逐步推理过程，从而成功绕过安全防护，使其生成有害内容或导致思维崩溃。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09742

arXiv 提交日期: 2026-03-10

theory machine learning model evaluation generalization bounds neural oscillators rademacher complexity dynamical systems pac learning

神经振荡器的泛化上界 / Upper Generalization Bounds for Neural Oscillators

1️⃣ 一句话总结

这篇论文从理论上证明了，一种基于二阶微分方程构建的‘神经振荡器’模型，其预测误差会随着模型规模和任务时长缓慢增长，从而避免了参数过多带来的‘维数灾难’，并且通过限制模型复杂度可以有效提升其在小样本数据下的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09349

arXiv 提交日期: 2026-03-10

machine learning model training model evaluation graph anomaly detection domain adaptation foundation model cross-domain generalization anomaly disassortativity

TA-GGAD：用于通用图异常检测的测试时自适应图模型 / TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

1️⃣ 一句话总结

这篇论文提出了一种新的图异常检测通用模型，它通过分析和解决跨域数据中的‘异常非匹配性’问题，仅需一次训练就能有效识别多种不同图数据中的异常节点，并在多个真实数据集上取得了领先的检测精度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.10413

1️⃣ 一句话总结

arXiv ID: 2603.10963

1️⃣ 一句话总结

arXiv ID: 2603.11001

1️⃣ 一句话总结

arXiv ID: 2603.10442

1️⃣ 一句话总结

arXiv ID: 2603.11027

1️⃣ 一句话总结

arXiv ID: 2603.10725

1️⃣ 一句话总结

arXiv ID: 2603.09772

1️⃣ 一句话总结

arXiv ID: 2603.10091

1️⃣ 一句话总结

arXiv ID: 2603.09742

1️⃣ 一句话总结

arXiv ID: 2603.09349

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.10413 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10963 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11001 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10442 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11027 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10725 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09772 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10091 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09742 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09349 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.10413

arXiv ID: 2603.10963

arXiv ID: 2603.11001

arXiv ID: 2603.10442

arXiv ID: 2603.11027

arXiv ID: 2603.10725

arXiv ID: 2603.09772

arXiv ID: 2603.10091

arXiv ID: 2603.09742

arXiv ID: 2603.09349