OpenCV_01基本操作
前言:总纲请查看《计算机视觉学习路》
环境配置:
新建requirements.txt,保存以下内容,然后执行命令创建虚拟环境
conda create --name py39-opencv --file requirements.txt
然后就可以在pycharm配置该环境进行编译
# This file may be used to create an environment using:
# $ conda create --name <env> --file <this file>
# platform: linux-64
_libgcc_mutex=0.1=conda_forge
_openmp_mutex=4.5=2_gnu
bzip2=1.0.8=h7f98852_4
ca-certificates=2022.5.18.1=ha878542_0
cvzone=1.5.6=pypi_0
cycler=0.11.0=pypi_0
evdev=1.5.0=pypi_0
fonttools=4.33.3=pypi_0
kiwisolver=1.4.2=pypi_0
ld_impl_linux-64=2.36.1=hea4e1c9_2
libffi=3.4.2=h7f98852_5
libgcc-ng=12.1.0=h8d9b700_16
libgomp=12.1.0=h8d9b700_16
libnsl=2.0.0=h7f98852_0
libuuid=2.32.1=h7f98852_1000
libzlib=1.2.11=h166bdaf_1014
matplotlib=3.5.2=pypi_0
ncurses=6.3=h27087fc_1
numpy=1.22.4=pypi_0
opencv-python=4.5.5.64=pypi_0
openssl=3.0.3=h166bdaf_0
packaging=21.3=pypi_0
pillow=9.1.1=pypi_0
pip=22.1.1=pyhd8ed1ab_0
pynput=1.7.6=pypi_0
pyparsing=3.0.9=pypi_0
python=3.9.12=h2660328_1_cpython
python-dateutil=2.8.2=pypi_0
python-xlib=0.31=pypi_0
python_abi=3.9=2_cp39
readline=8.1=h46c0cb4_0
setuptools=62.3.2=py39hf3d152e_0
six=1.16.0=pypi_0
sqlite=3.38.5=h4ff8645_0
tk=8.6.12=h27826a3_0
tzdata=2022a=h191b570_0
wheel=0.37.1=pyhd8ed1ab_0
xz=5.2.5=h516909a_1
zlib=1.2.11=h166bdaf_1014
1.创建窗口
使用Opencv的前提肯定是导入库啦
import cv2
1.窗口格式
创建一个名为new和new2的窗口:
cv2.nameWindow('new',cv2.WINDOW_AUTOSIZE) # 窗口不可以用鼠标进行拉伸
cv2.nameWindow('new2',cv2.WINDOW_NORMAL) # 窗口可以用鼠标进行拉伸
cv2.imshow('new',0) #用于显示new窗口
cv2.imshow('new2',0) # 用于显示new2窗口
2.窗口停留和销毁
在进行imshow的时候,为了让窗口停留(即在桌面显示) ,我们可以通过cv2.waitkey(毫秒数)函数,例如,让窗口停留一秒:
cv2.waitkey(1000)
同时我们可以从键盘接收一个值,当输入该值的时候,窗口才消失:
key=cv2.waitkey(0) # 这里填0,即一直等待
while True:
if key==113: # 这里本来应该写if key == 'q',但是我这里输入q的时候,key的值为int类型的113
break
在程序的最后我们需要销毁窗口:
cv2.destroyALLWindows()
3.设置窗口大小
cv2.resizeWindow('new',640,480) # 括号内的参数为:窗口名字,宽,高
4. 整体代码
import cv2
# 创建窗口
cv2.namedWindow('new', cv2.WINDOW_AUTOSIZE)
cv2.namedWindow('new2',cv2.WINDOW_NORMAL)
cv2.resizeWindow('new',640,480)
cv2.resizeWindow('new2',480,640)
cv2.imshow('new', 0) # 显示框口
cv2.imshow('new2', 0) # 显示框口
while True:
# 不断接收键盘按键
key = cv2.waitKey(0) # 接收键盘事件,如果输入q,则退出
if key == 113: # 按键q
print("退出")
break
cv2.destroyAllWindows()
2.加载图片
cv2.imread(路径, flags)
flags=0 : 读入灰色图片
flags=1: 读入彩色图片,BGR通道(忽略alpha通道)
flags=-1: 读入原图片,包括alpah通道
flag也可以不写,默认flags=1
import cv2
cv2.namedWindow('img', cv2.WINDOW_NORMAL)
img = cv2.imread('img/ex01.jpg',0) #读入灰色通道图片
cv2.imshow('img', img)
key = cv2.waitKey(0)
if key == 'q':
exit()
cv2.destroyAllWindows()
如果flags不写,来看一下:
img = cv2.imread('img/ex01.jpg')
3.保存图片
imwrite(name , img)
name:要保存的文件名
img:是Mat类型
下面判断,当键盘输入x的时候,保存图片为123.png
import cv2
cv2.namedWindow('img', cv2.WINDOW_NORMAL)
img = cv2.imread('img/ex01.jpg')
cv2.imshow('img', img)
while True:
key = cv2.waitKey(0)
print('key=',key)
print('type=',type(key))
if key == 113: # 按键q
print("退出")
break
elif key == 120: # 按键x
print("保存")
cv2.imwrite('img/123.png',img)
else:
print('other')
cv2.destroyAllWindows()
4. 读取视频文件
cap = cv2.VideoCapture(path)
这个时候cv2.waitkey( )里面的值就关系到视频播放速度的快慢,例如,我的视频为15帧/s,那么每一帧停留的时间为1000/15=66ms
import cv2
cv2.namedWindow('video',cv2.WINDOW_NORMAL)
cv2.resizeWindow('video',640,480)
# 从视频文件读取视频帧
cap = cv2.VideoCapture('img/ex02.mp4')
while True:
# 获取视频
ret,frame = cap.read()
cv2.imshow('video',frame)
# 这里如果填0,则一直等待键盘事件,只能获取到一帧视频帧然后就停住了
key = cv2.waitKey(66)
if key == 113:
break
# 释放资源
cap.release()
cv2.destroyAllWindows()
5.从摄像头读取视频
1.获取视频设备
cap = cv2.VideoCapture(0) # 0表示笔记本内置摄像头,1为外置摄像头,其他数字为其他设备2.从摄像头获取视频帧
ret,frame = cap.read()read返回两个值,第一个为状态值,读到帧为True,第二个为视频帧
3.释放资源的操作为:
cap.release()
需要注意的是,想要将读取到的视频帧在窗口中显示出来,并且按q退出时,key = cv2.waitKey(1),括号里不能填0,可以填一个比较小的值。否则程序会一直等待键盘事件,这样一来就只能获取一帧图片,然后就卡住了。具体代码如下:
import cv2
cv2.namedWindow('video',cv2.WINDOW_NORMAL)
cv2.resizeWindow('video',640,480)
# 获取视频设备
cap = cv2.VideoCapture(0)
while True:
# 获取视频
ret,frame = cap.read()
cv2.imshow('video',frame)
# 这里如果填0,则一直等待键盘事件,只能获取到一帧视频帧然后就停住了
key = cv2.waitKey(1)
if key == 113:
break
# 释放资源
cap.release()
cv2.destroyAllWindows()
6.视频录制保存
1.创建VieeoWriter
cv2.VideoWriter( ) # 参数:输出文件、int fourcc多媒体文件格式、帧率、分辨率(应复合摄像头参数)、颜色(默认True,彩色,填False则为灰色)
fourcc = cv2.VideoWriter_fourcc(*'MJPG') # 多媒体文件格式
2.写入数据
v2.write(获取到的视频帧)
3.释放资源:release( )
注:这里录好的视频是没有声音的,因为Opencv是处理图像的
这里对摄像头是否开启做了判断,并且对是否读到了视频帧也作了判断。
import cv2
# 创建VideoWriter为多媒体文件
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
vw = cv2.VideoWriter('img/out.mp4', fourcc, 25, (1920, 1080))
cv2.namedWindow('video', cv2.WINDOW_NORMAL)
cv2.resizeWindow('video', 1920, 1080)
cap = cv2.VideoCapture(0)
while cap.isOpened(): # 判断摄像头是否打开
ret, frame = cap.read()
if ret: # 判断是否为True,读到一帧显示一帧,如果为False,则不显示
cv2.imshow('video', frame)
vw.write(frame) # 写数据到多媒体文件
key = cv2.waitKey(1)
if key == 113:
break
else:
break
cap.release()
vw.release()
cv2.destroyAllWindows()
7.鼠标控制
1.自定义回调函数,即鼠标进行操作后需要执行的命令
callback(event x,y,flags,userdata) # 事件(鼠标移动,单击..) , 鼠标所在位置 , flags用于组合键
2.设置回调函数
cv2.setMouseCallback(窗口名字,callback, userdata) # callback,用户自定义的逻辑函数 userdata是给callback的参数,默认为None


完整代码为:
import cv2
import numpy as np
# 定义鼠标回调函数
def mouse_callback(event, x, y, flags, userdata):
print(event, x, y, flags, userdata)
# 创建窗口
cv2.namedWindow('mouse', cv2.WINDOW_NORMAL)
cv2.resizeWindow('mouse', 640, 480)
# 设置回调
cv2.setMouseCallback('mouse', mouse_callback, '调用回调函数')
# 利用numpy设置一个黑色的背景
img = np.zeros((480, 640, 3),np.uint8)
while True:
cv2.imshow('mouse', img)
key = cv2.waitKey(1)
if key == 113:
break
cv2.destroyAllWindows()
8.滑块TrackBar操作
cv2.createTrackbar(trackbarname , 窗口名, value:trackbar当前的值 , count:拖动值的范围是0-count , callback , userdata)
re = cv2.getTrackBarPos(trackbarname , 窗口名) # 返回trackbar的当前值
下面做显示一副黑色图片,根据RGB滑动条变化图片颜色,先看效果:
import cv2
import numpy as np
def callback(a):
pass
cv2.namedWindow('trackbar', cv2.WINDOW_NORMAL)
cv2.createTrackbar('R', 'trackbar', 0, 255, callback)
cv2.createTrackbar('G', 'trackbar', 0, 255, callback)
cv2.createTrackbar('B', 'trackbar', 0, 255, callback)
img = np.zeros((480, 640, 3),np.uint8)
while True:
# 读取trackbar的值
r = cv2.getTrackbarPos('R', 'trackbar')
g = cv2.getTrackbarPos('G', 'trackbar')
b = cv2.getTrackbarPos('B', 'trackbar')
# 读取到r,g,b的值后对img进行操作
img[:] = [b, g, r] # 对img的所有像素赋值为刚才读取到的r,g,b值
cv2.imshow('trackbar', img)
key = cv2.waitKey(10)
if key == 113:
break
cv2.destroyAllWindows()