苹果 Depth Pro登场：0.3 秒零样本从单张 2D 图片生成 3D 深度图

⋅ 2024-10-05 15:00:34 ⋅ 阅读 ⋅ 智能

IT之家 10 月 5 日消息，科技媒体 venturebeat 昨日（10 月 4 日）发布博文，报道称苹果 AI 科研团队发布了名为 Depth Pro 的全新 AI 模型，不需要传统相机数据预测，能够在几分之一秒内从单张 2D 图像生成详细的 3D 深度图。

该论文标题为《Depth Pro: Sharp Monocular Metric Depth in Less Than a Second》，是单目深度估计（Monocular Depth Estimation）领域的一次重大突破，整个过程仅使用一幅图像来推断深度信息。

对比苹果的 Depth Pro、Marigold、Depth Anything v2 和 Metric3D v2 的深度图。Depth Pro 在捕捉毛发和鸟笼铁丝等细节方面表现出色，仅需 0.3 秒即可生成清晰、高分辨率的深度图，在准确性和细节上超过其他模型。

根据论文介绍，该模型由 Aleksei Bochkovskii 和 Vladlen Koltun 团队领导，声称 Depth Pro 是同类型总生成速度最快、最准确的系统之一。

Depth Pro 在传统 GPU 上可以在 0.3 秒内生成高分辨率深度图，创建的图片共有 225 万像素，具有卓越的清晰度，能够捕捉到头发和植物等其它方法常常忽略的细节。

苹果 Depth Pro登场：0.3 秒零样本从单张 2D 图片生成 3D 深度图

Depth Pro 真正与众不同之处在于它能够估计相对深度和绝对深度，这一能力被称为“度量深度”（Metric depth）。

苹果 Depth Pro登场：0.3 秒零样本从单张 2D 图片生成 3D 深度图

Depth Pro 不需要在特定领域数据集上进行广泛训练即可做出准确预测，这一特性被称为“零样本学习”，这意味着该模型可以提供真实的测量数据，对增强现实（AR）等应用至关重要。

Depth Pro 目前已经在 Github 平台上开源，并鼓励开发者在机器人技术、制造业和医疗保健等领域进一步探索 Depth Pro 的潜力。

IT之家附上参考地址

- THE END -

本文由 @知闻楼 - 汇聚世界，洞见未来修订发布于 2024-10-05 15:00:34

本文来自投稿，不代表本站立场，如若转载，请注明出处：/tech/zhineng/8381.html

评论（共条评论，人围观）