arXiv最新AI论文速览速学

🔍

标签: #multi-view ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Stream3D: Sequential Multi-View 3D Generation via Evidential Memory 05-21

arXiv ID: 2605.21472

arXiv 提交日期: 2026-05-20

computer vision machine learning 3d generation multi-view streaming evidential memory temporal consistency

Stream3D：基于证据记忆的序列化多视角三维生成 / Stream3D: Sequential Multi-View 3D Generation via Evidential Memory

1️⃣ 一句话总结

Stream3D提出了一种无需重新训练的流式生成机制，通过一个紧凑的证据记忆模块，从不断变化的单目视频流中智能选择最关键的帧，使得已有的单视角3D生成器能够稳定、一致地生成连续的三维对象，解决了长序列下内存爆炸和结果跳变的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.14615

arXiv 提交日期: 2026-05-14

computer vision machine learning multi-modal camera calibration multi-view geometric consistency transformer robustness

CalibAnyView：超越单视角的野外相机标定 / CalibAnyView: Beyond Single-View Camera Calibration in the Wild

1️⃣ 一句话总结

本文提出了一种名为CalibAnyView的通用相机标定方法，能够处理任意数量的输入视角（包括单张图片），通过显式建模多视图间的几何一致性，在真实复杂场景中显著提升了标定精度，并支持动态场景、不同相机型号及镜头畸变条件下的可靠校准。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.28287

arXiv 提交日期: 2026-03-30

computer vision data systems 3d reconstruction dataset multi-view landmark high-resolution

TerraSky3D：欧洲地标的4K多视角三维重建数据集 / TerraSky3D: Multi-View Reconstructions of European Landmarks in 4K

1️⃣ 一句话总结

为了解决现有公开三维重建数据集在分辨率、规模和场景多样性上的不足，本研究创建了一个包含5万张高分辨率图像、涵盖150个地面与空中混合场景的欧洲地标大型数据集，并提供了精确的校准数据、相机位姿和深度图，旨在为复杂三维重建算法的训练与评估提供有力支持。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.23997

arXiv 提交日期: 2026-03-25

computer vision systems model training 3d reconstruction hand mesh multi-view camera pose estimation uncalibrated images

HGGT：从非标定图像中实现鲁棒且灵活的三维手部网格重建 / HGGT: Robust and Flexible 3D Hand Mesh Reconstruction from Uncalibrated Images

1️⃣ 一句话总结

这篇论文提出了一种新方法，能够直接从任意角度、未经校准的普通照片中，同时精确地重建出三维手部模型并估算拍摄角度，解决了现有技术要么精度不足、要么部署要求苛刻的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20566

arXiv 提交日期: 2026-02-24

robotics multi-modal model training token pruning vision-language-action robotic manipulation efficiency multi-view

BFA++：面向多视角视觉语言动作模型的分层最佳特征感知令牌剪枝 / BFA++: Hierarchical Best-Feature-Aware Token Prune for Multi-View Vision Language Action Model

1️⃣ 一句话总结

本文提出了一种名为BFA++的动态令牌剪枝框架，它通过分层策略智能筛选多视角图像中的关键视觉信息，从而在显著提升机器人操作模型计算速度的同时，保持甚至提高了任务执行的成功率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.07806

arXiv 提交日期: 2025-12-08

computer vision multi-modal model training 3d reconstruction transformer multi-view gaussian splatting scene understanding

多视图金字塔变换器：以更粗的视角看更广的范围 / Multi-view Pyramid Transformer: Look Coarser to See Broader

1️⃣ 一句话总结

这篇论文提出了一种名为MVP的新型多视图变换器架构，它通过从局部到全局、从精细到粗略的双重层次设计，能够高效地一次性从数十到数百张图像中重建出大规模且高质量的3D场景。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.13454

arXiv 提交日期: 2025-10-15

text-to-video multi-modal model training text-to-3d model stitching 3d reconstruction video generation multi-view

VIST3A：通过将多视角重建网络与视频生成器拼接实现文本到3D生成 / VIST3A: Text-to-3D by Stitching a Multi-view Reconstruction Network to a Video Generator

1️⃣ 一句话总结

这篇论文提出了一种名为VIST3A的新方法，通过巧妙拼接文本生成视频模型和3D重建网络，并利用对齐优化技术，实现了从文字描述直接生成高质量、逼真的3D场景，效果优于现有主流技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.21060

arXiv 提交日期: 2025-08-28

computer vision multi-modal model training 3d tracking point cloud multi-view correspondence estimation transformer

多视角三维点跟踪 / Multi-View 3D Point Tracking

1️⃣ 一句话总结

这篇论文提出了首个数据驱动的多视角三维点跟踪方法，能够利用少量摄像头实时、准确地追踪动态场景中的任意点，有效克服了单视角方法在深度模糊和遮挡方面的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.21472

1️⃣ 一句话总结

arXiv ID: 2605.14615

1️⃣ 一句话总结

arXiv ID: 2603.28287

1️⃣ 一句话总结

arXiv ID: 2603.23997

1️⃣ 一句话总结

arXiv ID: 2602.20566

1️⃣ 一句话总结

arXiv ID: 2512.07806

1️⃣ 一句话总结

arXiv ID: 2510.13454

1️⃣ 一句话总结

arXiv ID: 2508.21060

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.21472 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.14615 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.28287 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.23997 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20566 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.07806 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.13454 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.21060 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.21472

arXiv ID: 2605.14615

arXiv ID: 2603.28287

arXiv ID: 2603.23997

arXiv ID: 2602.20566

arXiv ID: 2512.07806

arXiv ID: 2510.13454

arXiv ID: 2508.21060