使用opencv和python实现图像的智能处理,python+opencv图像处理

  使用opencv和python实现图像的智能处理,python+opencv图像处理

  本文分别介绍了利用OpenCV和Pillow实现Python图像处理的方法,并通过示例代码进行了详细介绍。对大家的学习或者工作都有一定的参考价值,有需要的朋友可以参考一下。

  00-1010一、简介1.1图像处理-OpenCV1.2图像处理-PIL和枕头二。常见图像类型2.1二值图像2.2灰度图像2.3 RGB图像2.4常见色彩空间介绍三。OpenCV图像读取和显示3.1读入图像3.2显示图像3.3写出图像IV。图像几何变换4.1图像平移4.2图像旋转4.3图像缩放

  

目录

  在实现计算机视觉任务的过程中,不可避免地要对图像进行读写和预处理。下面是两个常用的Python图像处理库:OpenCV和Pillow。

  OpenCV是由英特尔公司资助的开源计算机视觉库。

  它由一系列C函数和少量C类组成,实现了图像处理和计算机视觉中的许多通用算法,如特征检测与跟踪、运动分析、目标分割与识别、三维重建等。OpenCV作为一款基于C/C语言的跨平台开源软件,可以运行在Linux、Windows、Android和MacOS操作系统上。同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉中的多种通用算法。

  

一、简介

  OpenCV是模块化的,有以下主要模块。

  【核心】核心功能模块,包括OpenCV的基本数据结构、动态数据结构、绘图功能、数组操作相关功能、辅助功能和系统功能和宏,以及与OpenGL的互操作性。【img Proc】图像处理模块,包括线性和非线性图像滤波、图像几何变换、图像转换、直方图相关、结构分析和形状描述、运动分析和物体跟踪、特征检测、目标检测等。【特征2d】-2D】-2D功能模块,包括以下内容:特征检测与描述、特征检测器、描述符提取器等。【High GUI】高级GUI图形用户界面,包括:媒体的I/O输入输出、视频捕捉、图像和视频的编解码、图形交互界面的接口等。

  

1.1 图像处理-OpenCV

  作为Python2的第三方图像处理库,是Pillow的前身。随着Python3的更新,PIL被移植到Python3并改名为Pillow。和OpenCV一样,Pillow也是模块结构,主要包括以下结构。

  [图像]图像功能模块,包括读取和写入图像、图像混合、图像缩放、图像裁剪和图像旋转。【图像过滤】图像过滤功能模块,包括:各种图像过滤核心。【图像增强】图像增强功能模块,包括色彩增强、亮度增强、对比度增强和清晰度增强。[ImageDraw]图像绘制功能模块,包括绘制几何形状和字符。

  

1.2 图像处理- PIL和Pillow

  

二、常用图像类型

  二值图像只有黑白两种颜色,如图。图像中的每个像素只能是黑色或白色,没有中间过渡。所以二值图像的像素值只能是0或1,0代表黑色,1代表白色。

  

2.1 二值图像

  灰度图像只表达了图像的亮度信息,没有颜色信息,如图(a)所示。灰度图像的每个像素只包含一个量化的灰度(即灰度值)。如图(b)所示,一个像素的亮度等级通常用1个字节(8位二进制数)来存储灰度值,所以正整数表示的灰度值范围是0~255。

  e="text-align:center">

  

  

2.3 RGB图像

  

  • RGB(Red、Green、Blue)图像如(a)图,可以看成是由多个RGB像素点组成。
  • 每个彩色像素点分别由R、G、B三种颜色空间组成如(b)图,本质是3维数组。
  • 在RGB颜色空间中,任意色光都可以用R、G、B三色不同分量的相加混合而成。

  

  

  

2.4 常用颜色空间简介

  实际应用中常用的颜色空间很多,通常使用3个独立的变量对颜色进行描述,例如RGB、HSV、YUV等。

  一个图像的不同的颜色空间是可以转换的,cv2.cvtColor可以实现颜色的转换。

  • cv2.COLOR_BGR2GRAY

  • cv2.COLOR_BGR2RGB

  • cv2.COLOR_BGR2HSV

  • cv2.COLOR_BGR2YUV

  • cv2.COLOR_BGR2HLS

  

  

三、OpenCV图像读写与显示

  通过OpenCV库对数字图像进行处理时,涉及到的基础操作包括读取、显示、写出图像文件。

  在OpenCV库中,图像数据是以NumPy数组的形式存在。

  

  

3.1 读入图像

  在python的OpenCV中,通过cv2.imread()函数读入图像数据,其基本使用格式如下。cv2.imread(filename, flags)

  在默认情况下通过cv2.imread()

  函数读入图像数据为3通道的彩色图,像素值为8位的非负整数,图像数据以NumPy中ndarray的方式存在。

  如果定义了cv2.imread()读入模式为cv2.IMREAD_GRAYSCALE那么读入图像为单通道的灰度图。

  需要注意的是,通过OpenCV读入彩色图像数据的颜色通道顺序为BGR(蓝、绿、红)并非常用的RGB(红、绿、蓝)顺序。

  在OpenCV中,读取到的图像数组维度可以表示为:

  (高,宽,通道数)即(height, width, channel)。OpenCV图像坐标与常规的数学坐标有区别,左上角位置为坐标原点。

  • 在Windows【画图】工具中,帽檐红点坐标为(248, 102),但在OpenCV中像素位置应为(102, 248)。

  • X轴 == 列位置 == 图像宽

  • Y轴 == 行位置 == 图像高

  

  

  

3.2 显示图像

  

  • 在OpenCV中,通过cv2.imshow()函数显示图像数据,其基本使用格式如下。
  • cv2.imshow(winname, img)
  • 在OpenCV中,通过cv2.waitKey()函数设置图片窗口显示时长,其基本使用格式如下。
  • cv2.waitKey([,delay])
  • waitKey作用是图像显示时等待用户按键触发,如果用户按键触发或时间超过了设置的时间则退出图片展示。
  • cv2.waitKey(0)的作用是令程序一直停留在显示图像的状态。如果没有增加cv2.waitKey(0),那么程序运行完毕后,图像显示窗口会自动关闭,即一闪而逝。

  

  

3.3 写出图像

  

  • 在OpenCV中,通过cv2.write()函数保存图像数据,其基本使用格式如下。
  • cv2.imwrite(filename, img)

  

import cv2

  import matplotlib.pyplot as plt

  import numpy

  # 读写图像

  img = cv2.imread(filename=lena.jpg, flags=cv2.IMREAD_GRAYSCALE)

  img.shape

  # (377, 373)

  img.dtype

  # dtype(uint8)

  # 图像展示

  cv2.imshow(winname=lena, mat=img)

  cv2.waitKey(0)

  # 图像保存

  cv2.imwrite(filename=test_img.jpg, img=img)

  

  

四、图像几何变换

  

  

4.1 图像平移

  图像平移变换将一幅图像中的所有像素点都按照给定的偏移量在水平方向(沿x轴方向)或垂直方向(沿y轴方向)移动,是图像几何变换中较为简单的一种变换。

  图像平移原理示意图如下图所示。

  

  假设对点P_0 (x_0,y_0 )进行平移后得到点P(x,y),其中x方向的平移量为∆x,y方向的平移量为∆y ,则点P(x,y)的坐标如下式。

  

  利用齐次坐标表示图像平移变换前后点P_0 (x_0,y_0 )到点P(x,y)的关系如下式所示。

  

  实现步骤:

  1. 定义平移变换矩阵: 例如:np.float32([[1,0,50], [0,1,100]])

  • [1,0,50]表示在x轴方向移动50个单位

  • [0,1,100]表示在y轴方向移动100个单位

  2. 执行转换:cv2.warpAffine (src, M, dsize)

  

  通过OpenCV实现图像平移操作,结果如下图所示,(a)为原图和(b)为平移后图像。

  

  

import cv2

  import matplotlib.pyplot as plt

  import numpy as np

  img = cv2.imread(lena.jpg)

  height, width, channel = img.shape

  # 图像平移

  # 1、定义平移变换矩阵

  M = np.float32([[1,0,50], [0,1,100]])

  # 2、执行平移变换

  img_tran = cv2.warpAffine(src=img, M=M, dsize=(height, width))

  cv2.imshow(image translation, img_tran)

  cv2.waitKey(0)

  

  

  

4.2 图像旋转

  图像旋转(Rotation)是指图像以某一点为中心旋转一定的角度形成一幅新的图像的过程。通常是以图像的中心为圆心旋转,将图像中的所有像素点都旋转一个相同的角度。

  图像旋转原理如图所示,将点(x_0,y_0)绕原点o顺时针旋转至点(x_1,y_1 ),其中a为旋转角,r为点(x_0,y_0 )到原点的距离, b为原点o到点(x_0,y_0 )的线段与x轴之间的夹角。在旋转过程中, r保持不变。

  

  设旋转前,x_0、y_0的坐标分别为x_0=r cos⁡b、y_0=r sin⁡b,当旋转a角度后,坐标x_1、y_1的值分别如下式所示。

  

  上式的矩阵的形式如下式所示。

  

  实现步骤:

  1. 计算旋转变换矩阵: cv2.getRotationMatrix2D (center, angle, scale)

  

  2. 执行转换:cv2.warpAffine (src, M, dsize)

  

  通过OpenCV实现图像旋转,得到的效果如图所示。

  

  

# 图像旋转

  # 1、定义旋转变换矩阵

  M = cv2.getRotationMatrix2D(center=(height*0.5, width*0.5), # 旋转的中心位置坐标

   angle=45, # 旋转的角度

   scale=0.8 # 缩放比例

   )

  # 2、执行旋转变换

  img_rotation = cv2.warpAffine(img, M, dsize=(height,width))

  cv2.imshow(image_rotation, img_rotation)

  cv2.waitKey(0)

  

  

  

4.3 图像缩放

  图像比例缩放是指将给定的图像在x轴方向按比例缩放f_x倍,在y轴方向按比例缩放f_y倍,从而获得一幅新的图像。如果f_x=f_y,即x轴方向和y轴方向缩放的比率相同,此比例缩放为图像的全比例缩放。如果f_x≠f_y,那么图像的比例缩放会改变原始图像的像素间的相对位置,产生几何畸变。

  在OpenCV中cv2.resize(src, dsize, fx, fy, interpolation)可以实现图像缩放。

  

  具体实现图像缩放有多种插值方法,OpenCV的resize函数提供了如下5种常见方法。

  • 最邻近插值:cv2.INTER_NEAREST

  • 双线性插值:cv2.INTER_LINEAR

  • 区域插值:cv2.INTER_AREA

  • 三次样条插值:cv2.INTER_CUBIC

  • Lanczos插值:cv2.INTER_LANCZOS4

  

# 图像缩放

  # 1、直接指定缩放大小

  img_res = cv2.resize(img, dsize=(244,244))

  img_res.shape

  # (244, 244, 3)

  cv2.imshow(image_resize, img_res)

  cv2.waitKey(0)

  # 2、最近邻插值

  img_near = cv2.resize(img, dsize=None, fx=1.5, fy=1,

   interpolation=cv2.INTER_NEAREST)

  cv2.imshow(img_near, img_near)

  cv2.waitKey(0)

  

  到此这篇关于Python详细讲解图像处理的而两种库OpenCV和Pillow的文章就介绍到这了,更多相关Python图像处理内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: