yolo 图像识别,图像处理yolo
YOLOv4由vs2015 opencv440实现,YOLOv4通过专有数据集python接口(训练全零基点附件)调用vs2015 opencv440实现。并且,训练自己的数据集(完全零基点)(使用python接口调用一、环境介绍二、环境混凝土构造三、公式模型权重测试四、训练自己的数据集4.1darknet-master4.2demo测试4.3标记自己的数据集4.4训练自己的数据集4.4.1创建文件目录4.4.2拆分数据集4.4.2
Vs2015 opencv440实现YOLOv4,用完全零基点提供的数据集对其进行训练。使用python接口调用
由于最近的需求,对深度学习目标检测的几种算法进行了研究,但没有阐述具体算法的比较和特点。总之,YOLOv4算法最终确定。作为深度学习振动的流沙,把算法从无到有实现的过程记录下来,以备后用。
现在网上有很多关于如何在Windows中实现YOLOv4的教程,但是总感觉乱七八糟的。要找到一个真正可行的方法,需要不断的比较。是总结。希望以后学习的人能有所帮助。因为文中使用了别人的程序和图片,所以附上了所有与原文的链接。侵权请联系原作者删除。
一、环境介绍对于从零开始振荡的流沙,需要安装以下软件或环境
VS2015,VS2015是我们用的编译器,需要安装C和python环境。Python只在我们训练自己的数据集时使用;opencv440,opencv440是我们使用的图像处理库。opencv支持440到YOLOv4。请不要下载以下版本;http://www.Sina.com/http://www.Sina.com/,CUDA是英伟达推出的计算平台,基于英伟达图形架构,使用GPU执行复杂的图像操作NVIDIA驱动程序。cuDNN是CUDA专用的神经网络加速器包,和CUDA一起使用。CUDA10.2二。环境混凝土施工。Sina.com/
可以直接到官网vs下载地址下载最新的2019社区版。社区版可以免费试用。其实根据版本不同也没多大区别。都可以用。发现没有网络成员无法上传vs2015安装包。如果真的要用2015,请自己找。
下载完成后,点击vs_community.exe程序进行安装。
在选择函数中选择C和python进行安装。请耐心等待安装完成。cuDNN
链接:EUB8OJJS22YWXZWSYSKI1A,https://pan。Baidu.com/s/1
提取代码:qdpt
下载后,安装。具体安装教程请参考其他博客文章。以下是链接。Opencv安装和配置YOLOv4相关配置文件
CUDA和cuDNN安装教程,参考文章。NVIDIA驱动CUDA cuDNN安装教程VS2015
链接:https://pan.Baidu.com/s/1oh 36 wvqsbmr 3 _ oc 7 JB xeg
抽屉代码:erx3
直接下载这样的相关文件。第三,正式的模型权重测试和上述环境都构建成功,才能进行代码测试。用于测试的代码opencv4_YOLOv4.cpp位于下载的YOLOv4相关的配置文件中。我们做了一个新的C项目。
用opencv4_yolov4.cpp替换主程序,在如图所示的程序位置新建model和image两个文件夹。
只需点击运行。
小贴士:
1.将模式更改为发布x64。
2.每次创建新程序时,为了使用opencv库,您必须在该程序中重新配置opencv环境。
四。训练自己的数据集4.1darknet-master在训练自己的YOLOv4数据集时,需要使用原作者制作的darknet-master。这里用C语言做的东西可以直接下载到原作者的github。暗网下载地址
4.2演示测试接下来可以参考本文darknet测试的第二、三部分,完成一个简单的演示测试。但是没有参考他的第四部,他的这部分很混乱,所以单独加个介绍。
4.3用labelImg软件标记自己数据集的文本,下载地址,使用教程。
标记后,得到一系列xml文件。
小贴士:我们的照片最好用6位数命名。
4.4训练自己的数据集4.4.1创建文件目录在D:\ darknet-master \ build \ darknet目录下创建一个新的myData文件夹。
在对象文件夹下,新建注释、图像、图像集文件夹,在图像集下新建主要的文件夹,并在对象下放入之前下载的预训练文件yolov4。
在形象文件中存放我们的图片文件,在释文文件夹中存放图片对应的可扩展标记语言文件。
4.4.2 划分数据集接下来在对象文件夹下新建测试。巴拉圭程序,程序代码如下,并运行。
import OSI import randomtrainval _ percent=0.1 train _ percent=0.9 XML filepath= Annotations txtsavepath= ImageSets \ Main total _ XML=OS。list dir(xmlfilepath)num=len(total _ XML)list=range(num)TV=int(num * train val _ percent)tr=int(TV * train _ percent)train val=random。样本(列表、电视)训练=随机。样本。sample(train val,tr)ftrainval=open( ImageSets/Main/train val).运行后,我们在图像集/主下得到train.txt,val.txt,test.txt和trainval.txt四个文件。里面分别包含了:训练集、验证集、测试集、训练验证集对应的图片的名称。
4.4.3 转变数据集格式接下来,我们将标签标注得到的可扩展标记语言格式转变为YOLO使用的文本文件(文本文件)格式。在d:\ darknet-master \ build \ darknet路径下新建我的_标签。巴拉圭文件,代码如下
将xml.etree.ElementTree作为et导入pickle从OS导入列表目录导入OS,getcwdfrom os.path导入join#源代码sets=[(2012 , train ),( 2012 , val ),( 2007 , train ),( 2007 , val ),( 2007 , test)]sets=[(myData , train ,( myData , test)] #改成自己建立的myDataclasses=[mopian] #改成自己的类别def convert(size,box): dw=1 ./(size[0]) dh=1 ./(size[1])x=(box[0]box[1])/2.0-1y=(box[2]box[3])/2.0-1w=box[1]-box[0]h=box[3]-box[2]x=x * dw w=w * dw y=y * DH h=h * DH return(x,y,w,h)def convert_annotation(year,image _ id):in _ file=open( my data/Annotations/% s . XML (image _ id源代码VOCdevkit/VOC % s/Annotations/% s . XML out _ file=open( my data/labels/% s . txt %(image _ id), w) #源代码VOCdevkit/VOC % s/labels/% s . txt tree=et。解析(in _ file)root=tree。getroot()size=root。find( size )w=int(size。查找(宽度).text) h=int(size.find(height ).text)for obj in root。ITER( object ):不同=obj。查找(差分).text cls=obj.find(name ).如果cls不在classes或int(different)==1,则返回文本:continue cls _ id=classes。index(cls)xmlbox=obj。find( bnd box )b=(float(xmlbox。查找( xmin ).text)、float(xmlbox.find(xmax ).text)、float(xmlbox.find(ymin ).text)、float(xmlbox.find(ymax ).text)) bb=convert((w,h),b) out_file.write(str(cls_id) .join([str(a for a in bb]) \ n )wd=getcwd()for year,image _ set in sets:if not OS。路径。存在(我的数据/标签/):#改成自己建立的我的数据操作系统。make dirs( my data/labels/)image _ ids=open( my data/image sets/Main/% s . txt %(image _ set)).阅读()。剥离()。split()list _ file=open( my data/% s _ % s . txt %(year,image_set), w )for image _ id:list _ file。write( % s/my data/Images/% s . png \ n %(wd,image _ id))convert _ annotation(year,image_id) list_file.close()运行该程序,会在对象目录下生成一个标签文件夹一个myData_train.txt和myData_test.txt文件。将lavels文件夹下的txt文件全部复制到Images文件夹中。标签文件夹中文本文件(文本文件)是标注的类别和位置信息,具体含义如下:
4.4.4修改配置文件修改voc.data和yolov4-custom.cfg文件,这两个文件都是配置文件:将D:\ dark net-Master \ Build \ dark net \ x64 \ CFG下的yolov4-custom.cfg文件复制到myData文件夹下,重命名为my_yolov4.cfg,将voc.data文件复制到myData文件夹下,重命名为my_data.data。
修改my_yolov4.cfg文件(可以用记事本打开),修改规则如下
文件中还有几处需要修改。在文档里搜索【YOLO】,一共三个地方。在这三个地方下面,把滤镜改成(类别5)3,把类别改成自己的类别号。如下所示:
接下来,根据以下原则修改my_data.data文件
Classes=3 ##改为自己的分类号##改为自己的路径train=/home/XXX/darknet/my data/my data _ train . txt names=/home/XXX/darknet/my data/my data . names #以后需要创建这个文件backup=/home/XXX/darknet/my data/weights。接下来,在myData文件夹中创建myData.names文件,并输入您自己的类别名称。
这里,一切准备工作已经完成,接下来就是训练了。
执行d:\ darknet-master \ build \ darknet \ x64目录中的cmd命令(请将其修改为您自己的文件路径)。
darknet.exe探测器系列D:\ darknet-master \ build \ darknet \ my data \ my _ data . data D:\ darknet-master \ build \ darknet \ my data \ my _ yolov 4 . CFG D:\ darknet-master \ build \ darknet \ my data \ yolov 4 . conv . 137
4.4.5通过测试您自己的重量文件生成的重量文件将保存在weights文件夹中。训练完成后,您可以使用以下代码进行测试,并执行D:\ dark net-Master \ Build \ dark net \ x64目录中的cmd命令。/dark net detect d:\ dark net-master \ build \ dark net \ my data \ my _ yolov 4 . cfgd:\ dark net-master \ build \ dark net \ my data \ weights/my _ yolov 3 . weights 1.jpg得到了结果。
4.4.6更多检测命令请参考原作者github的帮助文档。
https://github.com/AlexeyAB/darknet
4.5调用python接口python的路径是D:\ darknet-master \ darknet _ images . py。
在使用这个接口之前,你需要学习dll文件。例如,如果我们要使用GPU版本,使用D:\ Darknet-Master \ Build \ Darknet \ YOLO _ CPP _ dll . SLN项目,选择发布x64,点击重新生成解决方案。
将在D:\ dark net-master \ build \ dark net \ x64目录下生成一系列dll文件。
将yolo_cpp_dll.dll和pythonVC2.dll两个文件复制到D:\darknet-master路径,也就是darknet_images.py所在的路径。
然后打开darknet_images.py,在终端中从命令行执行命令。
python darknet _ Images . py-input D:/darknet-master/build/darknet/my data/Images-weights D:/darknet-master/build/darknet/my data/my data/weights/my _ yolov 4 _ best . weights-config _ file D:/darknet-master/build/my data/my data . data-dont _ show
每一项是什么意思,如何设置?可以看到代码darknet_images.py的注释
参考文章https://blog.csdn.net/qq_45445740/article/details/108293324
https://blog.csdn.net/qq_45445740/article/details/108253155
https://www.cnblogs.com/answerThe/p/11481564.html
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。