arXiv最新AI论文速览速学

🔍

标签: #information bottleneck ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 161 72小时内新更新论文 72h更新 166 最新: Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck 03-16

arXiv ID: 2603.10351

arXiv 提交日期: 2026-03-11

llm model evaluation natural language processing translationese bias multilingual evaluation information bottleneck disentangled representation reward modeling

通过解耦信息瓶颈缓解多语言LLM作为评判者时的翻译腔偏见 / Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck

1️⃣ 一句话总结

这篇论文提出了一种名为DIBJudge的微调框架，通过信息压缩和解耦技术，有效减少了大语言模型在多语言评估中普遍存在的、倾向于机器翻译文本而非人工参考译文的系统性偏见。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08462

arXiv 提交日期: 2026-03-09

llm theory model training reasoning efficiency information bottleneck chain-of-thought reinforcement learning lossy compression

推理即压缩：通过条件信息瓶颈统一预算强制 / Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck

1️⃣ 一句话总结

这篇论文提出将大语言模型中的思维链推理视为一个压缩问题，通过一种新的条件信息瓶颈训练目标，在减少推理过程长度的同时，能更智能地保留关键逻辑信息，从而在控制计算成本的同时保持甚至提升任务准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02629

arXiv 提交日期: 2026-03-03

multi-modal model training machine learning anomaly detection incremental learning information bottleneck multimodal fusion catastrophic forgetting

迈向增量式统一多模态异常检测：从信息瓶颈视角增强多模态去噪 / Towards an Incremental Unified Multimodal Anomaly Detection: Augmenting Multimodal Denoising From an Information Bottleneck Perspective

1️⃣ 一句话总结

这篇论文提出了一种名为IB-IUMAD的新方法，通过结合Mamba解码器和信息瓶颈融合模块来过滤冗余和虚假特征，有效解决了多模态异常检测模型在学习新类别时容易忘记旧知识的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21508

arXiv 提交日期: 2026-02-25

aigc model training systems watermarking information bottleneck robustness intellectual property generative purification

WaterVIB：通过变分信息瓶颈学习最小充分水印表示 / WaterVIB: Learning Minimal Sufficient Watermark Representations via Variational Information Bottleneck

1️⃣ 一句话总结

这篇论文提出了一种名为WaterVIB的新方法，它利用信息瓶颈原理，让AI模型学会从图像中提取最核心、最不易被篡改的水印信息，从而显著提升了水印在面临AI生成内容攻击时的鲁棒性和安全性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04784

arXiv 提交日期: 2026-02-04

computer vision model training theory vision transformers attention mechanism information bottleneck mechanistic interpretability representation learning

从独立补丁到协调注意力：控制视觉Transformer中的信息流 / From independent patches to coordinated attention: Controlling information flow in vision transformers

1️⃣ 一句话总结

这篇论文通过在视觉Transformer的注意力机制中引入信息瓶颈，可以像调节旋钮一样控制模型内部的信息交流程度，从而让模型从‘各看各的’的局部处理平滑过渡到‘协同合作’的全局注意力，这有助于我们理解和分析模型内部的工作机制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.01554

arXiv 提交日期: 2026-02-02

multi-modal model training machine learning visual tokenization information bottleneck multimodal llms model compression unified understanding-generation

InfoTok：面向统一多模态大语言模型中容量受限共享视觉分词的信息流调控 / InfoTok: Regulating Information Flow for Capacity-Constrained Shared Visual Tokenization in Unified MLLMs

1️⃣ 一句话总结

本文提出了一种名为InfoTok的新方法，它通过信息瓶颈原理来调控视觉信息向统一多模态大模型的传递，优先保留对理解和生成任务都有用的核心结构信息，从而在有限的算力资源下，同时提升了模型的理解和生成能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.02035

arXiv 提交日期: 2026-02-02

multi-agents reinforcement learning systems communication efficiency information bottleneck vector quantization multi-agent reinforcement learning bandwidth optimization

基于信息瓶颈与矢量量化的带宽高效多智能体通信 / Bandwidth-Efficient Multi-Agent Communication through Information Bottleneck and Vector Quantization

1️⃣ 一句话总结

这项研究提出了一种新方法，让多个协作机器人或智能体在通信带宽有限的情况下，能够像‘说悄悄话’一样，只传递最关键的信息，从而在显著节省通信流量的同时，大幅提升了团队协作完成任务的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14152

arXiv 提交日期: 2026-01-20

llm natural language processing model evaluation prompt ordering causal attention information bottleneck multiple-choice qa attention mechanism

迷失于提示顺序：揭示语言模型中因果注意力的局限性 / Lost in the Prompt Order: Revealing the Limitations of Causal Attention in Language Models

1️⃣ 一句话总结

这篇论文发现，大语言模型在回答选择题时，将背景信息放在问题和选项之前，比反过来排列能显著提升准确率，其根本原因在于模型内部的因果注意力机制会阻止选项去‘看到’背景信息，从而造成信息瓶颈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.05870

arXiv 提交日期: 2026-01-09

llm reinforcement learning model training structured exploration information bottleneck latent policy optimization reasoning diversity rlvr

通过信息瓶颈潜在策略优化实现结构化探索：解决LLM推理中的探索崩溃问题 / IIB-LPO: Latent Policy Optimization via Iterative Information Bottleneck

1️⃣ 一句话总结

本文提出了一种名为I²B-LPO的新方法，通过熵驱动的潜在分支和信息瓶颈正则化，解决了大型语言模型在强化学习与可验证奖励（RLVR）推理任务中面临的探索崩溃问题，在保持推理准确性的同时显著提升了输出路径的语义多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.10351

1️⃣ 一句话总结

arXiv ID: 2603.08462

1️⃣ 一句话总结

arXiv ID: 2603.02629

1️⃣ 一句话总结

arXiv ID: 2602.21508

1️⃣ 一句话总结

arXiv ID: 2602.04784

1️⃣ 一句话总结

arXiv ID: 2602.01554

1️⃣ 一句话总结

arXiv ID: 2602.02035

1️⃣ 一句话总结

arXiv ID: 2601.14152

1️⃣ 一句话总结

arXiv ID: 2601.05870

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.10351 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08462 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02629 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21508 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04784 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.01554 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.02035 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14152 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.05870 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.10351

arXiv ID: 2603.08462

arXiv ID: 2603.02629

arXiv ID: 2602.21508

arXiv ID: 2602.04784

arXiv ID: 2602.01554

arXiv ID: 2602.02035

arXiv ID: 2601.14152

arXiv ID: 2601.05870