论文链接:http://arxiv.org/abs/2301.07525

发布时间:2023-04-11


一、研究方向:

3D数据集

二、研究动机:

提出OmniObject3D,是一个包含大量高质量真实扫描 3D 对象的广泛语义数据集。(而非合成数据集)

  1. 包含6000个对象,190个日常类别
  2. 每个3D对象均通过2D和3D传感器采集,提供纹理网格、点云、多视图渲染图像和多个真实采集的视频
  3. 具有精确的形状和逼真的外观

三、方法与技术:

  1. 预定义类别列表(与几个著名的 2D 和 3D 数据集共享许多共同类别,例如,覆盖了 ImageNet  中的 85 个类别和 LVIS 中的 130 个类别)
  2. 收集和高质量扫描各类别物体,获得3D模型
  3. 根据3D模型,用blender渲染多视角图像,用Open3D工具箱采样多分辨率点云
  4. 用iPhone 12 Pro拍摄360°视频,然后用COMAP注释帧

四、实验:

  1. Robust 3D Perception

  2. Novel View Synthesis

    • single-scene
    • cross-scene
  3. Neural Surface Reconstruction

    • dense-view
    • sparse-view
  4. 3D Object Generation

    • semantic distribution
    • diversity and quality

评价:

  • 包括切碎、咬一口等变体数据:

  • 看起来质量很高

推荐相关阅读:

  • ModelNet40: 12311个CAD模型,40个类别
  • ShapeNet: 51300个CAD模型,55个类别
  • ScanObjectNN: 15000个室内扫描场景点云,15个类别
  • GSO:1030个精细几何形状和纹理的家居,17个类别
  • AKB-48:2037个铰接物体模型,48个类别
  • CO3D v1: 19000个以对象为中心的视频
  • 3D-FUTRUE
  • ABO
  • DTU
  • BlendedMVS