arXiv最新AI论文速览速学

🔍

标签: #aigc ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 133 最新: Toward Inclusive Avatar Design with Limb Differences Through Artificial Intelligence 07-14

arXiv ID: 2607.11512

arXiv 提交日期: 2026-07-13

computer vision machine learning aigc 3d avatar limb differences inclusive design avatar generation body diversity

走向包容性肢体差异的AI驱动虚拟形象设计 / Toward Inclusive Avatar Design with Limb Differences Through Artificial Intelligence

1️⃣ 一句话总结

本文探讨了现有3D虚拟形象系统因忽视肢体差异人群而导致的不包容问题，分析了当前技术方案和设计指南的不足，并提出利用人工智能技术（如生成模型）来克服数据稀缺和动画局限，从而推动更具包容性的虚拟形象生成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.11885

arXiv 提交日期: 2026-07-13

aigc computer vision multi-modal text-to-image personalization identity tuning facial editing latent space

文本到图像个性化模型中的潜在身份微调 / Latent-Identity Tuning in Text-to-Image Personalization Models

1️⃣ 一句话总结

本文提出了一种无需额外训练的方法，通过探索预训练编码器中的潜在语义方向，实现对特定人物身份的精细局部编辑，同时保持不同生成图像中身份的一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.11117

arXiv 提交日期: 2026-07-13

audio aigc machine learning generative watermarking music generation diffusion models robustness neural codec

MusicMark：一种鲁棒的音乐生成式水印框架 / MusicMark: A Robust Generative Watermarking Framework for Music Generation

1️⃣ 一句话总结

为了解决现有音频水印方法在音乐上脆弱、容易被绕过或破坏的问题，本文提出了MusicMark——首个在音乐生成过程中直接将水印嵌入语义隐空间的水印框架，它能抵抗包括神经编解码器重合成在内的多种攻击，同时保持音乐质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.08246

arXiv 提交日期: 2026-07-09

computer vision aigc 4d generation skeleton-driven animation text-driven animation weakly supervised learning motion generation

SkelGen4D：基于弱监督骨骼的文本驱动网格动画4D生成 / SkelGen4D: Weakly-Supervised Skeleton-Based 4D Generation for Text-Driven Mesh Animation

1️⃣ 一句话总结

本文提出一种名为SkelGen4D的方法，能够根据文字描述自动生成3D模型的骨骼动画，无需人工标注每帧骨骼位置，并通过弱监督学习生成时间连贯、物理合理的动作，方便用户后期编辑和直接用于标准动画制作流程。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.08515

arXiv 提交日期: 2026-07-09

multi-modal model evaluation aigc text-to-image bias disability stereotypes benchmark sociological evaluation

超越轮椅与眼罩：使用INCLUDE-BENCH探究文本到图像模型中的残障刻板印象 / Beyond wheelchairs and blindfolds: Investigating disability stereotypes in T2I models with INCLUDE-BENCH

1️⃣ 一句话总结

该论文提出了首个大规模基准测试INCLUDE-BENCH，用于系统评估文本到图像模型对残障人群的刻板印象表现，发现模型普遍将残障简化为轮椅形象或缺乏多样性，并引入了新的量化指标来反映这些社会偏见。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.08331

arXiv 提交日期: 2026-07-09

aigc agents multi-modal creative process abductive reasoning artistic workflow compositional graph self-reflection

ArtMine：发现并形式化艺术创作过程 / ArtMine: Discovering and Formalizing Artistic Processes

1️⃣ 一句话总结

本文提出了ArtMine框架，能从零散的历史档案、草图、信件等资料中自动推断出艺术家创作作品的具体步骤，并将这些步骤转化为可视化的流程图和生成指令，从而让计算机不仅理解成品，更能理解艺术创作背后的决策过程。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.07880

arXiv 提交日期: 2026-07-08

machine learning aigc agents diffusion model human-object interaction full-body motion articulated objects generalization

GIRAF：迈向与可活动物体进行泛化性人体交互 / GIRAF: Towards Generalizable Human Interactions with Articulated Objects

1️⃣ 一句话总结

本文提出了一种基于文本条件的扩散模型，通过统一手物接触的物体中心表示、混合领域的训练策略以及基于接触的数据增强方法，成功生成了人体与可活动物体的全身协调动作，并在未见过的物体配置上展现出优于现有方法的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.07072

arXiv 提交日期: 2026-07-08

machine learning aigc multi-modal diffusion model quantum computing image generation hybrid model autoencoder

一种用于图像生成的混合量子-经典扩散模型 / An Hybrid Quantum-Classical Diffusion Model for Image Generation

1️⃣ 一句话总结

本文提出了一种将经典自编码器与量子扩散模型相结合的混合方法，通过先用自编码器压缩图像、再在小量子比特空间中执行去噪扩散过程，从而在有限量子资源下高效生成图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.07521

arXiv 提交日期: 2026-07-08

aigc agents multi-modal human-ai interaction structural design co-creation design space exploration vision-language model

摩擦中的创造力：面向探索性结构设计的人机交互 / Creativity from Friction: Human-AI Interaction for Exploratory Structural Design

1️⃣ 一句话总结

本文指出当前追求“一键生成”的AI不适合结构设计等创意领域，因为设计过程需要反复试错和约束摩擦来激发灵感，并提出了一个基于视觉语言模型的交互式AI系统，在减少重复建模劳动的同时保留能促进思考的摩擦，帮助设计师更灵活地探索结构方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2607.07232

arXiv 提交日期: 2026-07-08

machine learning aigc graph generation diffusion models graphon theory scalability jacobi process

DiPhon：基于图极限对象的可扩展图生成扩散模型 / DiPhon: Diffusion on Graphons for Scalable Graph Generation

1️⃣ 一句话总结

本文提出了一种名为DiPhon的图生成方法，利用图极限对象（graphon）的数学框架，将扩散模型扩展到任意大小的图生成上，使得模型在小图上训练后，无需重新训练即可直接生成更大规模、且保持关键拓扑特性的图。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2607.11512

1️⃣ 一句话总结

arXiv ID: 2607.11885

1️⃣ 一句话总结

arXiv ID: 2607.11117

1️⃣ 一句话总结

arXiv ID: 2607.08246

1️⃣ 一句话总结

arXiv ID: 2607.08515

1️⃣ 一句话总结

arXiv ID: 2607.08331

1️⃣ 一句话总结

arXiv ID: 2607.07880

1️⃣ 一句话总结

arXiv ID: 2607.07072

1️⃣ 一句话总结

arXiv ID: 2607.07521

1️⃣ 一句话总结

arXiv ID: 2607.07232

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2607.11512 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.11885 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.11117 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.08246 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.08515 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.08331 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.07880 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.07072 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.07521 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2607.07232 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2607.11512

arXiv ID: 2607.11885

arXiv ID: 2607.11117

arXiv ID: 2607.08246

arXiv ID: 2607.08515

arXiv ID: 2607.08331

arXiv ID: 2607.07880

arXiv ID: 2607.07072

arXiv ID: 2607.07521

arXiv ID: 2607.07232