arXiv ID:
2602.20159
一个超大规模视频推理数据集与评测套件 / A Very Big Video Reasoning Suite
1️⃣ 一句话总结
这篇论文创建了一个前所未有的超大规模视频推理数据集和评测框架,首次系统地研究了视频模型的推理能力,并发现了模型在未见任务上出现泛化能力的早期迹象。
一个超大规模视频推理数据集与评测套件 / A Very Big Video Reasoning Suite
这篇论文创建了一个前所未有的超大规模视频推理数据集和评测框架,首次系统地研究了视频模型的推理能力,并发现了模型在未见任务上出现泛化能力的早期迹象。
让保形预测器在医疗场景中更稳健:一项关于脑电图分类的案例研究 / Making Conformal Predictors Robust in Healthcare Settings: a Case Study on EEG Classification
这篇论文针对医疗场景中患者数据分布变化导致预测不确定性量化不准的问题,通过在脑电图癫痫分类任务中测试多种方法,发现采用个性化校准策略能显著提升预测的可靠性。
BioEnvSense:一个用于预防行为驱动型网络事件的人本安全框架 / BioEnvSense: A Human-Centred Security Framework for Preventing Behaviour-Driven Cyber Incidents
这篇论文提出了一个名为BioEnvSense的人本安全框架,它通过结合CNN和LSTM模型来分析人的生物特征和环境数据,以预测并主动干预因人为失误导致的高风险网络安全状况,从而减少相关事件的发生。
Softmax还不够(用于自适应共形分类) / Softmax is not Enough (for Adaptive Conformal Classification)
这篇论文提出了一种新方法,通过利用神经网络在Softmax激活前的原始输出(logits)中的信息,特别是使用亥姆霍兹自由能来衡量模型的不确定性,从而改进了共形预测框架,使其生成的预测集能更智能地根据输入样本的难易程度自动调整大小,在保证准确性的同时提高了效率。
基于大语言模型的应用需要系统级的威胁监控 / LLM-enabled Applications Require System-Level Threat Monitoring
这篇论文认为,由于大语言模型行为的不确定性和难以验证性,基于大模型的应用面临新的安全风险,因此必须建立系统级的威胁监控机制,将其作为可靠部署的前提,而不是仅仅依赖测试或防护栏式的防御。
ASTRI-Horn望远镜监测数据的多元时间序列预测:一种正常行为模型 / Multivariate time-series forecasting of ASTRI-Horn monitoring data: A Normal Behavior Model
本研究为ASTRI-Horn切伦科夫望远镜开发了一个基于多层感知机的正常行为预测模型,能够同时准确预测多个传感器数据长达数小时,其性能媲美更复杂的LSTM网络但训练更快,为实现在线异常检测和预测性维护系统奠定了基础。
用于羽流辐射剂量估算的插值驱动机器学习方法:XGBoost、随机森林与TabNet的比较研究 / Interpolation-Driven Machine Learning Approaches for Plume Shine Dose Estimation: A Comparison of XGBoost, Random Forest, and TabNet
本研究提出了一种结合插值技术的机器学习框架,用于快速估算核设施泄漏时空气中的辐射剂量,发现XGBoost模型在三种测试算法中预测最准确,并揭示了不同模型利用输入特征方式的差异。
视觉Transformer的遗忘能力基准测试 / Benchmarking Unlearning for Vision Transformers
这篇论文首次为视觉Transformer建立了机器遗忘能力的基准测试框架,通过系统评估不同算法在不同模型和数据上的表现,揭示了视觉Transformer的记忆特性,并为未来开发更安全、公平的AI提供了可复现的评估基础。
论随机网络蒸馏、深度集成与贝叶斯推断的等价性 / On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference
这篇论文在无限宽神经网络的极限下,从理论上证明了随机网络蒸馏(RND)这种轻量级不确定性估计方法,其核心信号等价于深度集成的预测方差,并且通过特定设计可以使其误差分布与贝叶斯推断的后验预测分布一致,从而为RND提供了坚实的理论依据并开辟了高效不确定性量化的新途径。
CountEx:通过范例与排除实现细粒度计数 / CountEx: Fine-Grained Counting via Exemplars and Exclusion
这篇论文提出了一个名为CountEx的新型视觉计数框架,它允许用户同时指定‘要数什么’和‘忽略什么’,从而在复杂场景中更准确地计数相似物体,并创建了一个新基准来验证其优越性能。
请先 登录 后再提交论文