【python】opencv总结

简介
基本操作
图像处理
- 几何变换

简介

安装：pip install opencv-python==3.4.2.17
测试：

import cv2
# 读一个图片并进行显示(图片路径需自己指定)
lena=cv2.imread("1.jpg")
cv2.imshow("image",lena)
cv2.waitKey(0)

利用SIFT和SURF进行特征提取的话，还需要pip install opencv-contrib-python==3.4.2.17

基础模块：core、highgui、imgproc

core模块实现了最核心的数据结构及其基本运算，如绘图函数、数组操作相关函数等。
highgui模块实现了视频与图像的读取、显示、存储等接口。
imgproc模块实现了图像处理的基础方法，包括图像滤波、图像的几何变换、平滑、阈值分割、形态学处理、边缘检测、目标检测、运动分析和对象跟踪等。

其余模块：

features2d模块用于提取图像特征以及特征匹配，nonfree模块实现了一些专利算法，如sift特征。
stitching模块实现了图像拼接功能。
FLANN模块（Fast Library for Approximate Nearest Neighbors），包含快速近似最近邻搜索FLANN 和聚类Clustering算法。
ml模块机器学习模块（SVM，决策树，Boosting等等）。
photo模块包含图像修复和图像去噪两部分。
video模块针对视频处理，如背景分离，前景检测、对象跟踪等。
G-API模块包含超高效的图像处理pipeline引擎

基本操作

读取图像
API：cv.imread()，
参数：

读取的图像
读取方式的标志

cv.IMREADCOLOR：以彩色模式加载图像，任何图像的透明度都将被忽略。这是默认参数。
cv.IMREADGRAYSCALE：以灰度模式加载图像
cv.IMREAD_UNCHANGED：包括alpha通道的加载图像模式。
可以使用1、0或者-1来替代上面三个标志

参考代码：

import numpy as np
import cv2 as cv
# 以灰度图的形式读取图像
img = cv.imread('messi5.jpg',0)

显示图像
API：cv.imshow()，
参数：

显示图像的窗口名称，以字符串类型表示
要加载的图像

注意：在调用显示图像的API后，要调用cv.waitKey()给图像绘制留下时间，否则窗口会出现无响应情况，并且图像无法显示出来。

参考代码：

# opencv中显示
cv.imshow('image',img)
cv.waitKey(0)
# matplotlib中展示 因为opencv读取的是BGR格式的 plt中用的是RGB格式的
# 怎么理解img[:,:,::-1] 首先是前两个维度全选，第三个维度是层上的。
# 也就是从层的角度来看，从后往前数，就完成了B通道和个R通道的转换
plt.imshow(img[:,:,::-1])

保存图像
API：cv.imwrite()，
参数：

文件名，要保存在哪里
要保存的图像

参考代码：

cv.imwrite('messigray.png',img)

绘制直线
API：cv.line(img,start,end,color,thickness)，
参数：

img:要绘制直线的图像
Start,end: 直线的起点和终点
color: 线条的颜色
Thickness: 线条宽度

绘制圆形
API：cv.circle(img,centerpoint, r, color, thickness)，
参数：

img:要绘制圆形的图像
Centerpoint, r: 圆心和半径

绘制矩形
API：cv.rectangle(img,leftupper,rightdown,color,thickness)，
参数：

img:要绘制矩形的图像
Leftupper, rightdown: 矩形的左上角和右下角坐标

添加文字
API：cv.putText(img,text,station, font, fontsize,color,thickness,cv.LINE_AA)，
参数：

img: 图像
text：要写入的文本数据
station：文本的放置位置
font：字体
Fontsize :字体大小

获取并修改图像中的像素点：我们可以通过行和列的坐标值获取该像素点的像素值。对于BGR图像，它返回一个蓝，绿，红值的数组。对于灰度图像，仅返回相应的强度值。使用相同的方法对像素值进行修改。

import numpy as np
import cv2 as cv
img = cv.imread('messi5.jpg')
# 获取某个像素点的值
px = img[100,100]
# 仅获取蓝色通道的强度值
blue = img[100,100,0]
# 修改某个位置的像素值
img[100,100] = [255,255,255]

获取图像的属性：img.shape、img.size、img.dtype
图像通道的拆分与合并：有时需要在B，G，R通道图像上单独工作。在这种情况下，需要将BGR图像分割为单个通道。或者在其他情况下，可能需要将这些单独的通道合并到BGR图像。

# 通道拆分
b,g,r = cv.split(img)
# 通道合并
img = cv.merge((b,g,r))

色彩空间的改变：
API：cv.cvtColor(input_image，flag)，
参数：

input_image: 进行颜色空间转换的图像
flag: 转换类型

cv.COLOR_BGR2GRAY : BGR↔Gray
cv.COLOR_BGR2HSV: BGR→HSV

图像加法：cv.add(img1,img2)，不推荐使用numpy数组直接相加，而是用cv的add方法
图像混合：cv.addweight(img1,x1,img2,x2)，相当于按权相加， i m g 1 ∗ x 1 + i m g 2 ∗ x 2 img_1*x_1+img_2*x_2 img1∗x1+img2∗x2
注：这里都要求两幅图像是相同大小的。

图像处理几何变换

【python】opencv总结

Python相关栏目本月热门文章