arXiv最新AI论文速览速学

🔍

标签: #contrastive learning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: RLCSD: Reinforcement Learning with Contrastive On-Policy Self-Distillation 06-11

arXiv ID: 2606.11709

arXiv 提交日期: 2026-06-10

reinforcement learning llm on-policy self-distillation contrastive learning reasoning style drift

基于对比策略的强化学习自蒸馏方法 / RLCSD: Reinforcement Learning with Contrastive On-Policy Self-Distillation

1️⃣ 一句话总结

该论文提出RLCSD方法，通过对比正确与错误提示下的师生分布差异，解决了在线自蒸馏中模型偏好模仿风格而非推理内容的问题，从而在数学和逻辑推理任务上稳定提升模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09672

arXiv 提交日期: 2026-06-08

machine learning natural language processing model training biomedical embeddings causal discovery contrastive learning hard negative mining model optimization

相关性并不足够：为个体因果发现嵌入人类元数据 / Correlation Is Not Enough: Embedding Human Metadata for Individual Causal Discovery

1️⃣ 一句话总结

本文发现现有的生物医学语言模型在判断毫无关联的两个概念时也会给出很高的相似度分数（如“皮质醇28 μg/dL”与“股市波动”的余弦相似度高达0.83），这导致以嵌入距离作为因果证据的大型行为模型（LBM）产生大量虚假因果链路；作者提出了BODHI的对比训练方法，通过从生物医学知识图谱中挖掘难负样本，将跨领域区分度提升2.30倍，并结合OpenVINO在支持AMX的英特尔至强处理器上实现了133倍的速度提升（单查询从1367毫秒降至10毫秒），同时发现FP16精度在该硬件上全面优于INT8。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05697

arXiv 提交日期: 2026-06-04

llm agents multi-modal ui/ux evaluation persona-conditioned synthetic users contrastive learning user simulation

PerceptUI：作为人类对齐的合成用户进行UI/UX评估的大语言模型智能体 / PerceptUI: LLM Agents as Human-Aligned Synthetic Users for UI/UX Evaluation

1️⃣ 一句话总结

本文提出PerceptUI框架，通过两阶段训练让大语言模型模拟特定类型用户的真实反应，从而在界面评估中替代部分人工测试，既降低成本又保持结果与人类判断高度一致。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.29380

arXiv 提交日期: 2026-05-28

multi-modal model training finetuning contrastive learning catastrophic forgetting out-of-distribution robustness knowledge distillation

TRACER：面向鲁棒多模态微调的持久正则化方法 / TRACER: Persistent Regularization for Robust Multimodal Finetuning

1️⃣ 一句话总结

本文提出一种名为TRACER的新方法，通过加权移动平均教师模型引导的多视角蒸馏技术，解决了多模态模型微调时常见的分布外性能下降问题，在保持预训练知识的同时显著提升了模型在未知数据上的准确性和置信度校准能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.13229

arXiv 提交日期: 2026-05-13

llm machine learning code translation preference optimization semantic reward contrastive learning syntax guidance

通过语法引导和语义感知偏好优化改进代码翻译 / Improving Code Translation with Syntax-Guided and Semantic-aware Preference Optimization

1️⃣ 一句话总结

该论文提出了一种名为CTO的新方法，通过结合语法检查和对比学习训练的语义模型，在代码翻译中同时保证语法正确和功能等价，显著提升了大型语言模型在不同编程语言间的翻译质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.13544

arXiv 提交日期: 2026-05-13

medical multi-modal model training contrastive learning 3d medical imaging vision-language pre-training representation collapse zero-shot detection

跨解剖结构全局-局部对比学习：用于鲁棒的三维医学图像理解 / CA-GCL: Cross-Anatomy Global-Local Contrastive Learning for Robust 3D Medical Image Understanding

1️⃣ 一句话总结

这篇论文提出了一种新的跨解剖结构全局-局部对比学习框架（CA-GCL），通过引入全局对比目标来区分不同解剖结构，并结合临床感知的文本增强策略，有效解决了现有医学视觉-语言预训练模型中文本嵌入空间坍塌和模型对提示词敏感的问题，从而在零样本异常检测和跨数据集泛化上取得了更稳定、更优的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.03361

arXiv 提交日期: 2026-05-05

multi-modal model evaluation audio text-audio retrieval reasoning benchmark negation temporal reasoning contrastive learning

ReasonAudio：评估文本-音频检索中超越匹配的推理能力的基准 / ReasonAudio: A Benchmark for Evaluating Reasoning Beyond Matching in Text-Audio Retrieval

1️⃣ 一句话总结

该论文提出了ReasonAudio，首个专门用于评估文本-音频检索中复杂推理能力（如否定理解、时间顺序、事件重叠、时长判断等）的基准测试，并通过实验发现当前最先进的模型在这些推理任务上表现不佳，尤其是否定和时长判断，且多模态大模型的嵌入方法在对比微调后丢失了原有推理能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.02374

arXiv 提交日期: 2026-05-04

llm natural language processing model training machine-generated text few-shot detection adversarial training robustness contrastive learning

以毒攻毒：利用对抗训练增强少样本机器生成文本检测的鲁棒性 / Fight Poison with Poison: Enhancing Robustness in Few-shot Machine-Generated Text Detection with Adversarial Training

1️⃣ 一句话总结

本文提出一种名为REACT的对抗训练框架，通过让一个攻击者使用检索增强生成技术制造逼真的机器文本陷阱，并让检测器在与这些陷阱对抗中学习，从而在仅有少量训练样本的情况下，大幅提升检测器识别机器生成文本的准确性和抗攻击能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27861

arXiv 提交日期: 2026-04-30

llm security jailbreak defense contrastive learning decompositional attack latency optimization threat detection

双子门：通过非对称对比学习实现对不可追踪流量中分解式越狱攻击的有状态防御 / TwinGate: Stateful Defense against Decompositional Jailbreaks in Untraceable Traffic via Asymmetric Contrastive Learning

1️⃣ 一句话总结

本文提出了一种名为TwinGate的轻量级防御框架，通过双编码器结构和非对称对比学习，能够在用户身份完全匿名、请求顺序混乱的真实场景中，高效识别并拦截那些将恶意问题拆分成多个无害子问题的分解式越狱攻击，同时保持极低的误报率和计算开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27606

arXiv 提交日期: 2026-04-30

machine learning multi-modal systems tabular data contrastive learning self-supervised learning remote sensing feature encoding

ZAYAN：面向表格遥感数据的解耦对比变换器 / ZAYAN: Disentangled Contrastive Transformer for Tabular Remote Sensing Data

1️⃣ 一句话总结

该论文提出了一种名为ZAYAN的自监督学习框架，通过在特征层面而非样本层面进行对比学习，有效解决了遥感表格数据中异质性高、标签稀缺和特征冗余的问题，并在多个数据集上取得了优于现有方法的准确性和鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.11709

1️⃣ 一句话总结

arXiv ID: 2606.09672

1️⃣ 一句话总结

arXiv ID: 2606.05697

1️⃣ 一句话总结

arXiv ID: 2605.29380

1️⃣ 一句话总结

arXiv ID: 2605.13229

1️⃣ 一句话总结

arXiv ID: 2605.13544

1️⃣ 一句话总结

arXiv ID: 2605.03361

1️⃣ 一句话总结

arXiv ID: 2605.02374

1️⃣ 一句话总结

arXiv ID: 2604.27861

1️⃣ 一句话总结

arXiv ID: 2604.27606

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.11709 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09672 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05697 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.29380 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.13229 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.13544 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.03361 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.02374 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27861 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27606 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.11709

arXiv ID: 2606.09672

arXiv ID: 2606.05697

arXiv ID: 2605.29380

arXiv ID: 2605.13229

arXiv ID: 2605.13544

arXiv ID: 2605.03361

arXiv ID: 2605.02374

arXiv ID: 2604.27861

arXiv ID: 2604.27606