arXiv最新AI论文速览速学

🔍

aigc ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: GlyphPrinter: Region-Grouped Direct Preference Optimization for Glyph-Accurate Visual Text Rendering 03-17

arXiv ID: 2602.04043

arXiv 提交日期: 2026-02-03

computer vision aigc model training 3d reconstruction 3d gaussian splatting multimodal stylization feed-forward zero-shot

AnyStyle：面向3D高斯泼溅的单次多模态风格化方法 / AnyStyle: Single-Pass Multimodal Stylization for 3D Gaussian Splatting

1️⃣ 一句话总结

这篇论文提出了一个名为AnyStyle的前馈式3D重建与风格化框架，它能够仅通过一次处理，就利用文本描述或参考图片等不同模态的输入，为3D高斯泼溅模型实现无需特定拍摄姿态的、高质量的零样本风格化控制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03826

arXiv 提交日期: 2026-02-03

computer vision model training aigc diffusion models image editing video editing guidance scale continuous control

通过自适应原点引导实现对编辑模型的连续控制 / Continuous Control of Editing Models via Adaptive-Origin Guidance

1️⃣ 一句话总结

这篇论文提出了一种名为AdaOr的新方法，它能让用户像调节音量一样平滑地控制AI对图片或视频的编辑强度，解决了现有模型要么不改、要么全改的‘跳跃式’编辑问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.01494

arXiv 提交日期: 2026-02-02

multi-modal aigc education human-ai collaboration drawing-based learning scaffolding generative learning interactive system

Draw2Learn：一个用于基于绘画的科学学习的人机协作工具 / Draw2Learn: A Human-AI Collaborative Tool for Drawing-Based Science Learning

1️⃣ 一句话总结

这篇论文介绍了一个名为Draw2Learn的人机协作工具，它利用人工智能作为学习伙伴，通过生成绘画任务、提供视觉辅助和即时反馈，来帮助学生在科学学习中通过绘画更好地理解和构建知识。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22515

arXiv 提交日期: 2026-01-30

computer vision model evaluation aigc forgery detection neural anchors feature decoupling synthetic benchmark few-shot learning

DNA：揭示通用的潜在伪造知识 / DNA: Uncovering Universal Latent Forgery Knowledge

1️⃣ 一句话总结

这篇论文提出了一种名为DNA的新方法，它无需对预训练模型进行大量重新训练，而是通过一种从粗到精的挖掘机制，唤醒模型内部已有的、对伪造痕迹敏感的神经元，从而高效、通用地检测AI生成的虚假内容。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22276

arXiv 提交日期: 2026-01-29

model evaluation aigc data shapley value attribution text-to-image data valuation computational efficiency

SurrogateSHAP：一种无需重新训练的文本到图像模型贡献者归属方法 / SurrogateSHAP: Training-Free Contributor Attribution for Text-to-Image (T2I) Models

1️⃣ 一句话总结

这篇论文提出了一种名为SurrogateSHAP的新方法，它能够高效、无需重新训练地评估和量化不同数据贡献者对文本生成图像模型性能的影响，从而为公平的数据补偿和模型审计提供支持。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21314

arXiv 提交日期: 2026-01-29

computer vision model training aigc 3d mesh generation autoregressive model efficient inference geometric consistency latent modeling

HiFi-Mesh：通过紧凑自回归依赖实现高保真高效三维网格生成 / HiFi-Mesh: High-Fidelity Efficient 3D Mesh Generation via Compact Autoregressive Dependence

1️⃣ 一句话总结

这篇论文提出了一种名为LANE的新方法，通过引入紧凑的自回归依赖关系和创新的自适应计算图重构策略，在生成高质量、细节丰富的三维网格模型时，相比现有方法能处理长6倍的序列并大幅提升生成速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22093

arXiv 提交日期: 2026-01-29

multi-modal model evaluation aigc social bias associational bias inter-model communication demographic drift image generation

探究大型生成模型间通信中的关联性偏见 / Investigating Associational Biases in Inter-Model Communication of Large Generative Models

1️⃣ 一句话总结

这项研究发现，在图像生成和描述交替进行的AI模型间通信中，模型会学习并传播关于人种、性别和年龄的刻板关联，导致下游任务（如识别人类活动和情绪）出现系统性偏见，并提出了相应的缓解策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.20642

arXiv 提交日期: 2026-01-28

model evaluation computer vision aigc diffusion models memorization detection anisotropy generative models image generation

通过对数概率的各向异性检测和缓解扩散模型中的记忆效应 / Detecting and Mitigating Memorization in Diffusion Models through Anisotropy of the Log-Probability

1️⃣ 一句话总结

这篇论文提出了一种新的方法来检测和缓解扩散模型中的记忆效应，该方法通过分析模型在生成过程中的内部信号（特别是对数概率分布的方向性），能够更快速、更准确地识别出模型是否在简单地复制训练数据，而不是进行真正的创造性生成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21028

arXiv 提交日期: 2026-01-28

aigc natural language processing multi-modal ai-generated content sexual content creator motivations ethics non-consensual imagery

“探索与实验的无尽领域”：AI生成性内容创作者的方法与动机 / "Unlimited Realm of Exploration and Experimentation": Methods and Motivations of AI-Generated Sexual Content Creators

1️⃣ 一句话总结

本研究通过对28位AI生成性内容创作者的访谈，首次系统揭示了他们从性探索、艺术创作到技术实验的多元动机，以及其中少数涉及非自愿亲密图像的制作，为理解这一新兴领域并制定有效治理政策提供了关键见解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.20540

arXiv 提交日期: 2026-01-28

video generation aigc systems world model video simulation open-source real-time generation long-term memory

推进开源世界模型 / Advancing Open-source World Models

1️⃣ 一句话总结

这篇论文介绍了一个名为LingBot-World的高性能开源世界模拟器，它能够基于视频生成技术，在多种风格环境中实现高保真、长时记忆和实时交互的动态模拟，旨在通过开源推动其在内容创作、游戏和机器人学习等领域的应用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.04043

1️⃣ 一句话总结

arXiv ID: 2602.03826

1️⃣ 一句话总结

arXiv ID: 2602.01494

1️⃣ 一句话总结

arXiv ID: 2601.22515

1️⃣ 一句话总结

arXiv ID: 2601.22276

1️⃣ 一句话总结

arXiv ID: 2601.21314

1️⃣ 一句话总结

arXiv ID: 2601.22093

1️⃣ 一句话总结

arXiv ID: 2601.20642

1️⃣ 一句话总结

arXiv ID: 2601.21028

1️⃣ 一句话总结

arXiv ID: 2601.20540

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.04043 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03826 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.01494 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22515 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22276 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21314 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22093 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.20642 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21028 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.20540 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.04043

arXiv ID: 2602.03826

arXiv ID: 2602.01494

arXiv ID: 2601.22515

arXiv ID: 2601.22276

arXiv ID: 2601.21314

arXiv ID: 2601.22093

arXiv ID: 2601.20642

arXiv ID: 2601.21028

arXiv ID: 2601.20540