3D 视觉,3d人脸数据集
1.KITTI Dataset KITTI Dataset由德国卡尔斯鲁厄理工学院和美国丰田理工学院联合创立,是目前世界上最大的计算机视觉算法评测数据集。该数据集用于评估计算机视觉技术在车辆环境中的性能,如立体图像、光流、视觉里程计、3D对象检测、3D跟踪和语义分割。KITTI包含从城市、农村和高速公路场景收集的真实图像数据,每幅图像中有多达15辆车辆和30名行人,以及不同程度的遮挡和截断。整个数据集由389对立体图像和光流图、39.2 km视觉测距序列和超过200k 3D标记物体的图像组成。
数据集链接:
http://www.cvlibs.net/datasets/kitti/raw_data.php
2.CityscapesCityscapes是一个相对较新的大规模数据集,它包含了在50个不同城市的街道场景中记录的各种立体视频序列。除了20000个弱标注帧的大集合,它还拥有5000帧高质量的像素级标注。因此,该数据集比以前的类似尝试大一个数量级。Cityscapes数据集旨在评估视觉算法在城市场景语义理解方面的性能:像素级、实例级和全景语义标注;支持旨在开发大量(弱)标注数据的研究,例如训练包括城市场景中双目图像和像素级语义分割标注在内的深度神经网络。
数据集链接:
https://www.cityscapes-dataset.com/
3.牛津数据集在牛津的一部分连续道路上收集了数百个数据,收集了各种天气、行人和交通状况下的数据,以及建筑和道路施工期间的数据。包含全景图像、激光雷达点云以及导航信息。
数据集链接:
https://robotcar-dataset.robots.ox.ac.uk/datasets/
4.ApolloScape百度Apollo开源数据集,包含3D物体检测、语义分割、物体跟踪、立体视觉、场景识别等信息,数据量巨大!
数据集链接:
http://apolloscape.auto/
5.BDD100K主要包括视频数据、道路目标检测、案例分割、可行驶区域等相关数据。
其中包括:
视频:100,000个高清视频序列,探索一天中不同时间、天气条件和驾驶场景下超过1,100小时的驾驶体验。我们的视频序列还包括GPS定位、IMU数据和时间戳。
道路目标检测:在100,000张图像上标记的二维边界,用于公共汽车、交通灯、交通标志、人、自行车、卡车、汽车、火车和乘客。
分割:使用像素级和丰富的实例级注释浏览10,000多幅不同的图像。
可驾驶区域:从10万张图片中学习复杂的驾驶决策。
数据集链接:
http://bdd-data.berkeley.edu/
6.Waymo Open DatasetWaymo数据集包含3000条驾驶记录,总时长16.7小时,每段平均时长约20秒。整个数据集包含600,000帧,具有大约2500万个3D边界框和2200万个2D边界框。
此外,数据集Waymo Open Dataset的多样性也有了很大的提高。数据集涵盖了不同的天气条件、白天和夜晚的不同时间段、市区和郊区的不同位置、不同的道路对象(如行人和自行车)等等。
数据集链接:
https://github.com/waymo-research/waymo-open-dataset
7.nuScenes数据集nuScenes数据集是自动驾驶公司nuTonomy建立的大规模自动驾驶数据集。这个数据集不仅包含相机和激光雷达,还记录雷达数据。这个数据集由1000个场景组成(即场景,这是这个数据集名字的由来)。每个场景20秒,包含各种场景。在每个场景中,有40个关键帧,即每秒2个关键帧,其他帧是扫描。关键帧是手动标注的,每一帧都有几个标注,以包围盒的形式标注。不仅标注了大小、范围,还标注了类别、知名度等等。不久前发布了该数据集的一个预告版(包含100个场景),正式版(1000个场景)的数据将于2019年发布。这个数据集在样本数量和标注形式上都非常好。它记录了车辆自身的运动轨迹(相对于全局坐标),包含了大量的传感器,可以用来实现更智能的识别算法和感知融合算法。
数据集链接:
https://www.nuscenes.org/download
8.华盛顿大学的3D相机校准数据库。
数据集链接:
http://www-cvr.ai.uiuc.edu/ponce_grp/data/mview/
9.Matterport 3D重建数据集大型RGB-D数据集。该数据集包含10,800个对齐的3D全景视图(RGB中每个像素的深度)和来自90个建筑规模场景的194,400个RGB深度图像。
数据集链接:
https://matterport.com/
10.现在Dataset3D人脸重建相关数据集。该数据集包含用iPhone X拍摄的100个对象的2054张2D图像,以及每个对象的单独3D头部扫描。头部扫描是评估的基本依据。受试者的年龄、身体质量指数和性别(55名女性和45名男性)不同。
数据集链接:
https://ringnet.is.tue.mpg.de/challenge
11.Pix3D单目图像的3D模型匹配数据。
数据集链接:
http://pix3d.csail.mit.edu/
12.室内场景的副本数据集高质量3D重建数据。该数据集包含18个高度逼真的室内场景重建数据集副本。每个场景由密集的网格、高分辨率和高动态范围(HDR)纹理、每个基本语义类和实例的信息以及平面镜和玻璃镜组成。copy的目标是使机器学习(ML)研究依赖于世界上视觉、几何和语义上真实的生成模型。
数据集链接:
https://github.com/facebookresearch/Replica-Dataset
13.Scan2CAD将CAD模型与扫描数据对齐(适用于三维物体姿态估计、三维重建)
对于公共数据集,我们提供:
7607扫描模型和CAD模型之间的关键点对应关系14225扫描和CAD之间的对象1506扫描2CAD基准测试集的附加注释包括:
557扫描模型与CAD模型的关键点对应关系:1160扫描与CAD之间的对象97扫描数据集链接:
https://github.com/skanti/Scan2CAD
14.ScanNetScanNet是一个RGB-D视频数据集,在1500多次扫描中包含250万个视图。通过3D相机姿态、表面重建和实例级语义分割(与3D重建相关)进行标注。
数据集链接:
http://www.scan-net.org/
15.NYC3Dcars为现实世界中的视觉任务设置的车辆检测数据库。
3D重建:NYC3DCAR中的每一张照片都已经被GEO注册到地球上,在以地球为中心的固定坐标系中提供了完整的相机内外信息,实现了与现有地理空间数据的无缝集成。地理数据:OpenStreetMap和NYC OpenData等支持数据库已经整合,以方便获取道路、人行道和中间多边形以及道路网络连接等地理特征。车辆注释:手工注释器提供了数据库中包含的车辆的详细描述。注释包括一个完整的6自由度车辆姿态,车辆类型,2D车辆边界框,以及大约一天的照片时间。数据集链接:
http://nyc3d.cs.cornell.edu/
16.表情丰富的手和脸(expressionable Hands and faces)数据集(具有丰富姿势的手和脸)包含了一个对象穿着最少的衣服,表演各种身体姿势的100个精确帧,包括自然的手指关节,以及一些面部关节和表情。
每个帧包括以下时间同步模式:
全身RGB图像。包含OpenPose检测到的二维特征(身体关节、手部关节、面部特征)的JSON文件。物体的三维扫描。与上面扫描的3D SMPL X(3D网格)对齐,并将其用作假地面真实值。地面上的伪真网格是用顶点到顶点(v2v)误差来度量的。这是一个比常见的三维关节误差范式更严格的测量标准,它不捕捉表面误差和骨骼的旋转。您可以使用SMPL-X模型和SMPLify-X代码从单幅RGB图像中重建三维人体。数据集链接:
https://smpl-x.is.tue.mpg.de/
17.TUM数据集主要包括多视图数据集、三维物体识别与分割、场景识别、三维模型匹配、vSALM等各个方向的数据。
数据集链接:
https://vision.in.tum.de/
18.EUROC数据集数据集主要包括立体影像、同步IMU测量、精确运动和真实地面结构。
数据集链接:
https://projects.asl.ethz.ch/datasets/doku.php?id=kmavvisualinertialdatasets
长按关注我们。
版权归作者所有:原创作品来自博主3D视觉工坊,转载授权请联系作者,否则将追究法律责任。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。