字符串转换成jsonarray,jsonarray的格式
对象的大纲和数据365 XML格式的数据注:Obj365和COCO数据集转换为xml格式以及转为yolo的txt格式,xml数据统计处理更改见GitHub:https://github.com/lidc1004/Object-detection-converts
1.Objects365数据集简介objects365是playview和北京致远人工智能研究院联合发布的目标检测新标准。它的所有图像数据都是在自然场景中设计和收集的。Objects365目标检测数据集主要用于解决365个目标类别的大规模检测,为目标检测研究提供各种实用标准。官方网站:3358 www . objects 365.org/overview.html
Objects365在超过63万张图像上标记了365个对象类,训练集中有超过1000万个包围盒,超过了Pascal VOC、ImageNet和COCO数据集。下表显示了Objects365与所有以前的目标发现数据集之间的比较,包括图像计数、边界框计数和对象类计数等参数。结果显示,Objects365的图像数和边框数分别是COCO的5倍和11倍,对象类型数和平均边框数最多。Objects365包含人、衣物、居室、浴室、厨房、办公、电器、交通、食物、水果、蔬菜、动物、运动、乐器14的大类,每个大类又有几十个小类。
2.数据集获取Objects365数据集的两个版本。2019对象365目标检测数据集,2020对象365目标检测数据集。
2019版还没有正式提供下载。这里是百度云盘的下载地址。链接:https://pan.Baidu.com/s/1 q1kpu 1 TWSOBRHOXR-TE9PA二维码:qiva复制打开百度网盘手机App。更方便。2020版官方下载地址:https://open.baai.AC.cn/data-set-enter-detail/12647.数据集处理对象365数据集很大,但实际使用中并没有那么大。必须标记指定的数据类型。其中,Object365_dict.txt中详细展示了365个类别,博客Object365数据集中365个类别的名称也有具体内容。
XML格式定义如下:
annotationfoldervoc 2012/Folder Filename 2007 _ 000392.jpg/filename//文件名来源//图像来源数据库TheVOC 2007数据库/Dabase SourceSize//图像大小(宽度、高度和通道数)宽度500/宽度高度332/高度深度3/深度/大小分段器检测到的对象名称马拍摄角度截断0/截断//Is难度0/难度//Is目标难以识别bndbox///边界坐标)xmin 100/xminmin 96/YMINNAME PERSON/NAMeposeUnspecified/PoseTruncated 0jpg vvr.jpg 3.2数据处理主要包括obj365_main.py和object。详情请参考个人GitHub,链接:3359github。
如果无法登录,可以通过博客资源下载,请点击代码下载链接(无需点击):3359 download.csdn.net/download/lidc 1004/19269039。
处理步骤如下。
python obj 365 _ main . py-I data/obj 365 -o output/sport -c 809297112113214143141431441651701821821951951999202
3.3数据输出目录结构如下
/path/to/output annotations _ XML _ train//标记目录XXX。XML //标记文件yyy.XML///标记文件批注标记目录xxx.xml批注文件批注_ XML _ object365 _ train.txt批注_ XML _ object365 _ val.txt恢复文件
XML文件路径图像路径[类1,类2。] XML文件路径相对于输出目录,图像路径相对于输入目录。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。