Cityscapes,Cityscape painting
这个github库包含了检查、准备和评估城市景观数据集的脚本。这个大型数据集包含了50个不同城市的街道场景中记录的各种立体视频序列,除了20000个弱标注帧,还包含了5000个高质量的像素级标注。
详情和下载链接,请访问:www.cityscapes-dataset.net。
结构数据集Cityscapes数据集的文件夹结构如下:
{ root }/{ type } { video }/{ split }/{ city }/{ city } _ { seq:06 } _ { frame:06 } _ { type } { ext }其中独立元素的含义是:
根Cityscapes数据集的根文件夹。我们的很多脚本都会检查指向这个文件夹的环境变量“CITYSCAPES_DATASET”是否存在,并将其作为默认目录。Type数据类型或形式,例如gtFine代表fine GroundTruth,leftImg8bit代表左摄像头的八位图像。分割部分,即训练、val、测试、额外训练或演示视频。请注意,并非所有类型的数据都存在于所有数据包中。所以偶尔发现一个空文件夹也不要惊讶。城市这部分数据集所属的城市。Seq序列号,使用6位数字。框架编号,使用6位数字。请注意,在一些城市中,虽然记录了非常长的序列,但在一些城市中记录了许多短序列,其中仅记录了文件帧19.ext的扩展名和可选后缀。例如,_polygons.json是GroundTruth文件类型的可能值。
GtFine fine精细笔记,2975ssdyc图,500个验证图,1525个测试图。这种类型的注释用于验证、测试和可选培训。注释使用包含单个多边形的“json”文件进行编码。此外,我们提供png图像,其中的像素值对标签进行编码。请参见helpers/labels.py中的脚本并准备详细信息。GtCoarse粗糙标注,可用于所有训练和验证图像以及另一组19998ssdyc图像(train_extra)。这些注释可以和gtFine一起用于训练,也可以在弱监督环境下单独使用。GtBboxCityPersons行人边界框标注,可用于所有训练和验证图像。更多详情请参见helpers/labels_cityPersons.py和cityPersons出版物(张等,17)。leftImg8bit的左图像是8位LDR格式。这些图像有标准的注释。左16位左图像,采用16位HDR格式。这些图像提供了每像素16位的色深,包含更多信息,尤其是在场景中非常暗或亮的部分。警告:图像存储为16位PNG,这是非标准的,并非所有库都支持。using 8位右图像,采用8位LDR格式。右16位右图像,16位HDR格式。时间戳以纳秒为单位记录时间。每个序列的第一帧的时间戳总是为0。视差预计算视差深度图。为了获得视差值,对于p 0的每个像素,计算p:d=(float(p)-1)/256,值p=0为无效度量。警告:图像存储为16位PNG,这是非标准的,并非所有库都支持。摄像机内部和外部摄像机校准。详见csCalibration.pdfvehicle车辆测距、GPS坐标、室外温度。详情请参考csCalibration.pdf。随着时间的推移,可能会添加更多的类型,并且最初并不是所有类型都可用。如果您需要其他元数据来运行您的方法,请告诉我们。
拆分的可能值
Train通常用于训练,包含2975个带有粗略或精细注释的图像。val应该用于验证超参数,并包含500张带有精细和粗略注释的图像。也可以用来训练。测试用于在我们的评估服务器上进行测试。笔记不公开,但为了方便,我们收录了自车和整改边界的笔记。Train_extra可以有选择地用于训练。它包含19,998张带有粗略注释的图像。demoVideo可以用于视频序列的定性评估。这些视频不提供带注释的脚本。在名为scripts的文件夹中有包含几个脚本的数据集。
Helpers由其他脚本文件调用。查看器用于查看图像和注释。脚本准备用于将GroundTruth注释转换成适合您的方法的格式。脚本注释用于注释数据集。请注意,所有文件的顶部都有一个小文档。非常重要
Helpers/labels.py定义了所有语义类id的中心文件,并提供了各种类属性之间的映射。helper/labels _ CityPersons.py文件定义了所有CityPersons行的ID,并提供了各种类属性之间的映射。Viewer/cityscapesViewer.py查看图像并覆盖注释。paragraph/createtrainilabellimgs . py将多边形格式的注释转换为带有label ID的png图像,其中像素代码可以是“labels.py”中定义的“训练ID”。paragraph/createtrainindinstanceimgs . py将多边形格式的注释转换为带有实例ID的png图像,其中像素代码是由“train ID”组成的实例ID。evaluation/evalpixelevelsemantic labeling . py该脚本评估验证集的像素级语义标记结果。这个脚本也用于评估测试集的结果。evaluation/evalistanceevelsemanticlabeling . py此脚本评估验证集的实例级语义标签结果。这个脚本也用于评估测试集的结果。Setup.py运行setup.py build_ext - inplace以启用cython插件,从而加快评估速度。仅针对Ubuntu进行了测试。可以通过pip安装脚本,如下所示:
sudo pip安装。
该脚本作为名为cityscapesscripts的python模块安装,并公开以下工具。请参考以上说明:
csviewercslabeltoolcsevalpixelevelementclabelingcsevalinstanceevelsemanticlabelingcscreatetraainidlabelimgscreatetraainidinindinstanceimgs请注意,对于您需要安装的图形工具:
sudo apt安装python-tk python-qt4
评估如果您想在测试集上测试您的方法,请在您提供的测试图像上运行您的方法并提交结果:
www.cityscapes-dataset.net/submit/
对于语义注释,我们要求结果格式与名为labelIDs的标签图像的格式相匹配。
因此,您的代码应该生成图像,其中每个像素的值对应于labels.py中定义的类ID
请注意,我们的评估脚本包含在脚本文件夹中,可用于在验证集上测试您的方法。
有关提交流程的更多详情,请访问我们的网站。
联系我们如果您有任何问题、建议或意见,请随时联系我们:
穆罕默德Omranmail@cityscapes-dataset.netwww.cityscapes-dataset.net马里乌斯科尔茨
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。