arXiv最新AI论文速览速学

🔍

aigc ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Talking Slide Avatars: Open-Source Multimodal Communication Approach for Teaching 05-02

arXiv ID: 2603.04001

arXiv 提交日期: 2026-03-04

llm natural language processing aigc higher education faculty perspectives pedagogical integration academic integrity stem education

STEM领域教师对高等教育中生成式人工智能的看法 / STEM Faculty Perspectives on Generative AI in Higher Education

1️⃣ 一句话总结

这项研究通过访谈美国大学STEM教师发现，他们对在教学中使用生成式AI既看到辅助教学的价值，也担忧其对学生学习、评估和学术诚信的挑战，并指出有效整合需要从教学、评估到学校政策进行系统性反思。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02897

arXiv 提交日期: 2026-03-03

computer vision model training aigc image compression generative models residual vector quantization progressive transmission lightweight architecture

ProGIC：基于残差向量量化的渐进式轻量生成图像压缩 / ProGIC: Progressive and Lightweight Generative Image Compression with Residual Vector Quantization

1️⃣ 一句话总结

这篇论文提出了一种名为ProGIC的轻量级图像压缩方法，它利用残差向量量化实现渐进式编码，在保证高感知质量的同时，大幅提升了压缩效率和传输灵活性，并能在多种设备上快速运行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02598

arXiv 提交日期: 2026-03-03

aigc computer vision model training synthetic data posture estimation privacy preservation edge deployment 3d human model

Synthetic-Child：一种基于AIGC的合成数据管道，用于隐私保护的儿童姿态估计 / Synthetic-Child: An AIGC-Based Synthetic Data Pipeline for Privacy-Preserving Child Posture Estimation

1️⃣ 一句话总结

这篇论文提出了一种名为Synthetic-Child的创新方法，它利用人工智能生成内容技术，在不使用任何真实儿童照片的情况下，创建了大量逼真的合成图像来训练儿童姿态估计模型，从而有效解决了数据收集中的隐私和伦理问题，并取得了比传统方法更好的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02802

arXiv 提交日期: 2026-03-03

video generation aigc computer vision video editing motion consistency unpaired training temporal coherence sparse control

NOVA：面向无配对视频编辑的稀疏控制与密集合成框架 / NOVA: Sparse Control, Dense Synthesis for Pair-Free Video Editing

1️⃣ 一句话总结

这篇论文提出了一个名为NOVA的新框架，它通过让用户只编辑视频中的少量关键帧来提供语义指导，同时利用原始视频的运动和纹理信息进行密集合成，从而在无需大量配对训练数据的情况下，实现了高质量、时序连贯的视频编辑。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02882

arXiv 提交日期: 2026-03-03

aigc video generation model training invisible watermarking video diffusion blind extraction causal 3d vae robustness

SIGMark：一种用于视频扩散模型的、支持盲提取的可扩展生成中水印技术 / SIGMark: Scalable In-Generation Watermark with Blind Extraction for Video Diffusion

1️⃣ 一句话总结

这篇论文提出了一种名为SIGMark的新方法，它能在AI生成视频的过程中直接嵌入看不见的水印，并且无需存储大量密钥就能高效地检测出来，同时还能有效抵抗视频在时间和空间上的修改，解决了现有技术成本高、不抗干扰的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02943

arXiv 提交日期: 2026-03-03

model training aigc multi-modal diffusion models sampling acceleration feature caching pade approximation image generation

TC-Padé：用于扩散加速的轨迹一致性帕德逼近 / TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration

1️⃣ 一句话总结

这篇论文提出了一种名为TC-Padé的新方法，它通过更精确的数学逼近和自适应策略来加速扩散模型的图像和视频生成过程，在减少计算步骤的同时保持高质量输出，显著超越了现有的加速技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03066

arXiv 提交日期: 2026-03-03

video generation aigc benchmark video quality assessment educational videos text-to-video dataset multi-dimensional evaluation

EduVQA：面向教育领域的AI生成视频质量评估基准 / EduVQA: Benchmarking AI-Generated Video Quality Assessment for Education

1️⃣ 一句话总结

这篇论文提出了首个用于评估教育类AI生成视频质量的基准数据集和评估框架，并通过一个创新的模型来同时衡量视频的视觉逼真度和内容与教学提示的匹配程度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02175

arXiv 提交日期: 2026-03-02

video generation aigc model training video editing instruction following reference guidance data generation multi-modal control

Kiwi-Edit：通过指令和参考引导实现多功能视频编辑 / Kiwi-Edit: Versatile Video Editing via Instruction and Reference Guidance

1️⃣ 一句话总结

这篇论文提出了一个名为Kiwi-Edit的视频编辑新方法，它通过结合文字指令和参考图像来更精准地控制编辑效果，并创造了一个大规模训练数据集来提升模型性能，在可控视频编辑任务上达到了当前最佳水平。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02210

arXiv 提交日期: 2026-03-02

computer vision aigc model training image inpainting reference-based generation detail preservation human-product images attention mechanism

HiFi-Inpaint：面向生成细节保留的人-物图像的高保真参考修复方法 / HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images

1️⃣ 一句话总结

这篇论文提出了一个名为HiFi-Inpaint的新框架，通过引入共享增强注意力和细节感知损失，并构建一个新的大规模数据集，专门用于生成能高保真保留产品细节的人与产品融合图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02359

arXiv 提交日期: 2026-03-02

computer vision machine learning aigc causal inference visual attributes deepfakes advertising double machine learning

利用观察数据评估广告中的视觉属性效应：一种基于深度伪造信息的双重机器学习方法 / Estimating Visual Attribute Effects in Advertising from Observational Data: A Deepfake-Informed Double Machine Learning Approach

1️⃣ 一句话总结

这篇论文提出了一种名为DICE-DML的新方法，它巧妙地利用深度伪造技术生成图像对，并结合机器学习，首次成功地从广告图片中分离出特定视觉属性（如模特肤色）对消费者参与度的真实因果影响，解决了传统方法因图像信息混杂而产生严重偏差的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.04001

1️⃣ 一句话总结

arXiv ID: 2603.02897

1️⃣ 一句话总结

arXiv ID: 2603.02598

1️⃣ 一句话总结

arXiv ID: 2603.02802

1️⃣ 一句话总结

arXiv ID: 2603.02882

1️⃣ 一句话总结

arXiv ID: 2603.02943

1️⃣ 一句话总结

arXiv ID: 2603.03066

1️⃣ 一句话总结

arXiv ID: 2603.02175

1️⃣ 一句话总结

arXiv ID: 2603.02210

1️⃣ 一句话总结

arXiv ID: 2603.02359

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.04001 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02897 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02598 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02802 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02882 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02943 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03066 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02175 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02210 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02359 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.04001

arXiv ID: 2603.02897

arXiv ID: 2603.02598

arXiv ID: 2603.02802

arXiv ID: 2603.02882

arXiv ID: 2603.02943

arXiv ID: 2603.03066

arXiv ID: 2603.02175

arXiv ID: 2603.02210

arXiv ID: 2603.02359