arXiv最新AI论文速览速学

🔍

标签: #adversarial training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Twincher: Bijective Representation Learning for Robust Inversion of Continuous Systems 05-14

arXiv ID: 2605.13470

arXiv 提交日期: 2026-05-13

machine learning robotics inverse problems representation learning bijective mapping adversarial training robustness

Twincher：用于连续系统鲁棒逆映射的双射表示学习 / Twincher: Bijective Representation Learning for Robust Inversion of Continuous Systems

1️⃣ 一句话总结

本文提出了一种名为Twincher的新型架构，通过学习输入与输出之间的双射（一一对应）表示，并结合抗干扰训练，使AI系统在数据有限、存在噪声或模型误差的情况下，依然能高效且稳定地从观测结果反推回原始状态，这对机器人、视觉和物理AI等领域非常有用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.07039

arXiv 提交日期: 2026-05-07

llm reinforcement learning agents evolutionary search test-time adaptation adversarial training policy learning optimization

PACEvolve++：改进进化搜索智能体的测试时学习 / PACEvolve++: Improving Test-time Learning for Evolutionary Search Agents

1️⃣ 一句话总结

这篇论文提出了一种名为PACEvolve++的强化学习框架，通过在测试阶段动态调整策略，帮助进化搜索智能体更快、更稳定地找到最优解，从而显著提升在工程设计与生物计算等昂贵评估任务中的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.02374

arXiv 提交日期: 2026-05-04

llm natural language processing model training machine-generated text few-shot detection adversarial training robustness contrastive learning

以毒攻毒：利用对抗训练增强少样本机器生成文本检测的鲁棒性 / Fight Poison with Poison: Enhancing Robustness in Few-shot Machine-Generated Text Detection with Adversarial Training

1️⃣ 一句话总结

本文提出一种名为REACT的对抗训练框架，通过让一个攻击者使用检索增强生成技术制造逼真的机器文本陷阱，并让检测器在与这些陷阱对抗中学习，从而在仅有少量训练样本的情况下，大幅提升检测器识别机器生成文本的准确性和抗攻击能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19724

arXiv 提交日期: 2026-04-21

computer vision theory machine learning vision transformers adversarial training benign overfitting robust generalization theoretical analysis

对抗训练中视觉Transformer的良性过拟合 / Benign Overfitting in Adversarial Training for Vision Transformers

1️⃣ 一句话总结

本文首次从理论上证明了，在特定信号噪声比和适度扰动强度下，视觉Transformer（ViT）通过对抗训练不仅能实现近乎零的鲁棒训练损失和良好的泛化能力，而且即使模型出现过度拟合，这种过拟合反而是“良性”的——不会损害模型对对抗样本的防御效果，从而将之前仅在卷积神经网络（CNN）中观察到的现象推广到了ViT中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01169

arXiv 提交日期: 2026-04-01

machine learning model training systems generative models distribution alignment adversarial training simulation-to-real domain adaptation

利用生成模型和对抗性分布对齐弥合仿真与实验间的鸿沟 / Bridging the Simulation-to-Experiment Gap with Generative Models using Adversarial Distribution Alignment

1️⃣ 一句话总结

这篇论文提出了一种名为对抗性分布对齐（ADA）的数据驱动方法，通过先利用仿真数据训练一个生成模型，再将其与真实但部分观测的实验数据分布进行对齐，从而有效弥合了复杂系统仿真与真实实验之间的差距。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.27720

arXiv 提交日期: 2026-03-29

computer vision aigc model training image generation differential query transformer brushstroke prediction adversarial training neural painting

观察、比较与绘制：用于自动油画创作的差分查询变换器 / Look, Compare and Draw: Differential Query Transformer for Automatic Oil Painting

1️⃣ 一句话总结

这篇论文提出了一种新的自动油画生成方法，通过模拟人类“观察、比较、绘制”的创作过程，引入差分图像分析来指导模型关注每一笔的增量效果，从而用更少的笔触生成更逼真、更具艺术感的油画作品。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.24209

arXiv 提交日期: 2026-03-25

machine learning systems model training federated learning personalization heterogeneous data adversarial training knowledge distillation

HEART-PFL：一种在数据异构环境下通过分层方向对齐与对抗知识迁移实现稳定个性化联邦学习的框架 / HEART-PFL: Stable Personalized Federated Learning under Heterogeneity with Hierarchical Directional Alignment and Adversarial Knowledge Transfer

1️⃣ 一句话总结

这篇论文提出了一个名为HEART-PFL的新框架，它通过分层方向对齐和对抗知识迁移两种技术，在保护用户数据隐私的联邦学习场景下，有效解决了因数据分布不均导致的模型训练不稳定问题，从而为每个用户训练出更精准、更稳定的个性化模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12110

arXiv 提交日期: 2026-03-12

reinforcement learning agents model training robust rl adversarial training continuous control minimax optimization policy gradient

驯服对抗者：通过分数目标实现稳定的极小极大深度确定性策略梯度 / Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

1️⃣ 一句话总结

这篇论文提出了一种新的强化学习方法，通过引入一个平衡任务表现与干扰强度的分数目标，让智能体在与模拟“对手”的对抗训练中，学习到更稳定、更能抵抗环境干扰和模型不确定性的控制策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11565

arXiv 提交日期: 2026-03-12

medical machine learning theory causal inference counterfactual estimation time series representation learning adversarial training

CAETC：用于时序反事实估计的因果自编码与治疗条件化方法 / CAETC: Causal Autoencoding and Treatment Conditioning for Counterfactual Estimation over Time

1️⃣ 一句话总结

本文提出了一种名为CAETC的新方法，它通过结合因果自编码和治疗条件化技术，有效克服了时序观测数据中的混杂偏差，从而更准确地预测不同治疗方案下的潜在结果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10521

arXiv 提交日期: 2026-03-11

llm model training model evaluation instruction hierarchy safety robustness reinforcement learning adversarial training

IH挑战：一个用于提升前沿大语言模型指令层级能力的训练数据集 / IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

1️⃣ 一句话总结

这篇论文提出了一个名为IH-Challenge的训练数据集，专门用来训练大语言模型学会在接收到相互冲突的指令时，能按照预设的优先级（如系统指令高于用户指令）做出正确响应，从而有效抵御恶意攻击并提升模型的安全性，实验表明使用该数据集训练能显著提升模型在这方面的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.13470

1️⃣ 一句话总结

arXiv ID: 2605.07039

1️⃣ 一句话总结

arXiv ID: 2605.02374

1️⃣ 一句话总结

arXiv ID: 2604.19724

1️⃣ 一句话总结

arXiv ID: 2604.01169

1️⃣ 一句话总结

arXiv ID: 2603.27720

1️⃣ 一句话总结

arXiv ID: 2603.24209

1️⃣ 一句话总结

arXiv ID: 2603.12110

1️⃣ 一句话总结

arXiv ID: 2603.11565

1️⃣ 一句话总结

arXiv ID: 2603.10521

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.13470 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.07039 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.02374 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19724 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01169 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.27720 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.24209 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12110 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11565 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10521 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.13470

arXiv ID: 2605.07039

arXiv ID: 2605.02374

arXiv ID: 2604.19724

arXiv ID: 2604.01169

arXiv ID: 2603.27720

arXiv ID: 2603.24209

arXiv ID: 2603.12110

arXiv ID: 2603.11565

arXiv ID: 2603.10521