「深度学习一遍过」必修27：基于Mask

def _colorize_mask(mask, color None): # 没有传入颜色则随机产生颜色若传入颜色则按传入颜色来绘制 b mask * np.random.randint(0, 255) if not color else mask * color[0] g mask * np.random.randint(0, 255) if not color else mask * color[1] r mask * np.random.randint(0, 255) if not color else mask * color[2] # 返回值 R、G、B 三通道合并后的图 return cv2.merge((b, g, r)) # 定义一个关键点绘制函数 def _draw_keypoint(image, point, color, radius 1): # point返回值是包含三个数字的列表分别表示横、纵坐标及点半径 x, y, r point if int(r): # 用原点形式绘制关键点注 cv2.LINE_AA 为抗锯齿,这样看起来会非常平滑 cv2.circle(image, (int(x), int(y)), radius, color, -1, cv2.LINE_AA) return image # 定义一个关键点连接函数 def _draw_connection(image, point1, point2, color, thickness 1): x1, y1, v1 point1 x2, y2, v2 point2 if int(v1) and int(v2): # 连接关键点用直线注 cv2.LINE_AA 为抗锯齿,这样看起来会非常平滑 cv2.line(image, (int(x1), int(y1)), (int(x2), int(y2)), color, thickness, cv2.LINE_AA) return image # 定义一个预测框预测函数 def _draw_box(image, point1, point2, point3, point4, color, thickness 1): # point1 ~ point4 代表框选人物矩形的四个点位置注 yolo 中也是用同样的定点法 cv2.rectangle(image, (int(point1), int(point2)), (int(point3), int(point4)), color, thickness, cv2.LINE_AA) return image # 绘制掩膜 def draw_masks(image, masks, color None, alpha 0.5): # 在拷贝的image附件中执行下述代码 result image.copy() for mask in masks: # 显示图片前必须先转为uint8格式 mask_bin np.uint8(mask 0) # 通道融合 mask_inv cv2.merge([1 - mask_bin] * 3) # 绘制关键语句调用前面定义的_colorize_mask函数 mask_rgb _colorize_mask(mask_bin, color) # 彩色图像数组和掩膜图像数组相乘 result cv2.multiply(result, mask_inv) # 彩色图像数组和掩膜图像数组相加 result cv2.add(result, mask_rgb) # 返回值将原图像与掩膜叠加 return cv2.addWeighted(result, alpha, image, 1.0 - alpha, 0) # 绘制关键点 def draw_keypoints(image, keypoints, radius 1, alpha 1.0): result image.copy() for kp in keypoints: for p in kp: # 绘制关键语句调用前面定义的_draw_keypoint函数 result _draw_keypoint(result, p, (0, 255, 0), radius) return cv2.addWeighted(result, alpha, image, 1.0 - alpha, 0) # 连接关键点 def draw_body_connections(image, keypoints, thickness 1, alpha 1.0): result image.copy() b_conn [(0, 5), (0, 6), (5, 6), (5, 11), (6, 12), (11, 12)] h_conn [(0, 1), (0, 2), (1, 3), (2, 4)] l_conn [(5, 7), (7, 9), (11, 13), (13, 15)] r_conn [(6, 8), (8, 10), (12, 14), (14, 16)] for kp in keypoints: for i, j in b_conn: result _draw_connection(result, kp[i], kp[j], (0, 255, 255), thickness) for i, j in h_conn: result _draw_connection(result, kp[i], kp[j], (0, 255, 255), thickness) for i, j in l_conn: result _draw_connection(result, kp[i], kp[j], (255, 255, 0), thickness) for i, j in r_conn: result _draw_connection(result, kp[i], kp[j], (255, 0, 255), thickness) return cv2.addWeighted(result, alpha, image, 1.0 - alpha, 0) # 绘制预测框 def draw_body_box(image, keypoints, thickness 1): result image.copy() for kp in keypoints: result _draw_box(result, kp[0], kp[1], kp[2], kp[3], (0, 255, 255), thickness) return cv2.addWeighted(result, 0.5, image, 1.0 - 0.5, 0)

video_test.py

#!/usr/bin/python
# -*- coding:utf-8 -*-
# ------------------------------------------------- #
# 作者 赵泽荣
# 时间 2021年9月26日 农历八月二十 
# 个人站点 1.https://zhao302014.github.io/
# 2.https://blog.csdn.net/IT_charge/
# 个人GitHub地址 https://github.com/zhao302014
# ------------------------------------------------- #
import cv2
import numpy as np
from utils.utils import ConvolutionalPoseMachine, draw_body_connections, draw_keypoints, draw_masks, draw_body_box
# 实例化 ConvolutionalPoseMachine 类 True 为使用预训练模型 
estimator ConvolutionalPoseMachine(pretrained True)
# opencv 读入视频
cap cv2.VideoCapture( data/video.mp4 )
# 读取成功意味着 cap.isOpened() True 持续运行
while True:
 # frame 相当于一帧一帧的图像
 _, frame cap.read()
 # 传入视频帧至实例化后的 ConvolutionalPoseMachine 类
 pred_dict estimator(frame, masks True, keypoints True)
 # 调用定义的 get_masks 静态方法获取掩膜
 masks estimator.get_masks(pred_dict[ maskrcnn ], score_threshold 0.99)
 # 调用定义的 get_keypoints 静态方法获取关键点
 keypoints estimator.get_keypoints(pred_dict[ keypointrcnn ], score_threshold 0.99)
 # 调用定义的 get_boxes 静态方法获取关键点
 boxs estimator.get_boxes(pred_dict[ fasterrcnn ], score_threshold 0.99)
 # BGR 转灰度图像
 frame_dst cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
 # 合并单通道成多通道
 frame_dst cv2.merge([frame_dst] * 3)
 # 绘制掩膜
 overlay_m draw_masks(frame_dst, masks, color (0, 255, 0), alpha 0.5)
 # 绘制预测框
 overlay_b draw_body_box(frame_dst, boxs, thickness 3)
 # 连接关键点
 overlay_k draw_body_connections(frame, keypoints, thickness 2, alpha 0.7)
 # 绘制关键点
 overlay_k draw_keypoints(overlay_k, keypoints, radius 4, alpha 0.8)
 # 将参数元组的元素数组按水平方向及垂直方向进行叠加
 # 预计显示结果如下示意 
 # —————————————————————————————————
 # | 原图 | 掩膜预测图 |
 # —————————————————————————————————
 # | 关键点及连接绘制图 | 预测框绘制图 |
 # —————————————————————————————————
 # 水平排列
 image_h1 np.hstack((frame, overlay_m))
 image_h2 np.hstack((overlay_k, overlay_b))
 # 垂直排列
 image_v_and_h np.vstack((image_h1, image_h2))
 # 处理后的视频帧显示
 cv2.imshow( Video Show , image_v_and_h)
 # cv2.waitKey(x) x数值越小 理论上运行越快 运行速度也与电脑硬件运行处理图片速度有关 
 if cv2.waitKey(1) 0xff 27: # exit if pressed ESC 或按ESC退出 
 break
# 释放资源并关闭窗口
cap.release()
cv2.destroyAllWindows()

camera_test.py

#!/usr/bin/python
# -*- coding:utf-8 -*-
# ------------------------------------------------- #
# 作者 赵泽荣
# 时间 2021年9月26日 农历八月二十 
# 个人站点 1.https://zhao302014.github.io/
# 2.https://blog.csdn.net/IT_charge/
# 个人GitHub地址 https://github.com/zhao302014
# ------------------------------------------------- #
import cv2
import numpy as np
from utils.utils import ConvolutionalPoseMachine, draw_body_connections, draw_keypoints, draw_masks, draw_body_box
# 实例化 ConvolutionalPoseMachine 类 True 为使用预训练模型 
estimator ConvolutionalPoseMachine(pretrained True)
# opencv 调用摄像头
cap cv2.VideoCapture(0)
# 调用成功 持续运行
while True:
 # success 在视频读取时一直为 true img 相当于一帧一帧的图像
 success, img cap.read()
 # 传入视频帧至实例化后的 ConvolutionalPoseMachine 类
 pred_dict estimator(img, masks True, keypoints True)
 # 调用定义的 get_masks 静态方法获取掩膜
 masks estimator.get_masks(pred_dict[ maskrcnn ], score_threshold 0.99)
 # 调用定义的 get_keypoints 静态方法获取关键点
 keypoints estimator.get_keypoints(pred_dict[ keypointrcnn ], score_threshold 0.99)
 # 调用定义的 get_boxes 静态方法获取关键点
 boxs estimator.get_boxes(pred_dict[ fasterrcnn ], score_threshold 0.99)
 # BGR 转灰度图像
 frame_dst cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
 # 合并单通道成多通道
 frame_dst cv2.merge([frame_dst] * 3)
 # 绘制掩膜
 overlay_m draw_masks(frame_dst, masks, color (0, 255, 0), alpha 0.5)
 # 绘制预测框
 overlay_b draw_body_box(frame_dst, boxs, thickness 3)
 # 连接关键点
 overlay_k draw_body_connections(img, keypoints, thickness 2, alpha 0.7)
 # 绘制关键点
 overlay_k draw_keypoints(overlay_k, keypoints, radius 4, alpha 0.8)
 # 将参数元组的元素数组按水平方向及垂直方向进行叠加
 # 预计显示结果如下示意 
 # —————————————————————————————————
 # | 原图 | 掩膜预测图 |
 # —————————————————————————————————
 # | 关键点及连接绘制图 | 预测框绘制图 |
 # —————————————————————————————————
 # 水平排列
 image_h1 np.hstack((img, overlay_m))
 image_h2 np.hstack((overlay_k, overlay_b))
 # 垂直排列
 image_v_and_h np.vstack((image_h1, image_h2))
 # 处理后的视频帧显示
 cv2.imshow( Camera Show , image_v_and_h)
 # cv2.waitKey(x) x数值越小 理论上运行越快 运行速度也与电脑硬件运行处理图片速度有关 
 if cv2.waitKey(1) 0xff 27: # exit if pressed ESC 或按ESC退出 
 break
# 释放资源并关闭窗口
cap.release()
cv2.destroyAllWindows()

image_test.py

#!/usr/bin/python
# -*- coding:utf-8 -*-
# ------------------------------------------------- #
# 作者 赵泽荣
# 时间 2021年9月26日 农历八月二十 
# 个人站点 1.https://zhao302014.github.io/
# 2.https://blog.csdn.net/IT_charge/
# 个人GitHub地址 https://github.com/zhao302014
# ------------------------------------------------- #
import cv2
import numpy as np
from utils.utils import ConvolutionalPoseMachine, draw_body_connections, draw_keypoints, draw_masks, draw_body_box
# 实例化 ConvolutionalPoseMachine 类 True 为使用预训练模型 
estimator ConvolutionalPoseMachine(pretrained True)
# opencv 读入图片
img cv2.imread( data/image.jpg )
# 传入图片至实例化后的 ConvolutionalPoseMachine 类
pred_dict estimator(img, masks True, keypoints True)
# 调用定义的 get_masks 静态方法获取掩膜
masks estimator.get_masks(pred_dict[ maskrcnn ], score_threshold 0.99)
# 调用定义的 get_keypoints 静态方法获取关键点
keypoints estimator.get_keypoints(pred_dict[ keypointrcnn ], score_threshold 0.99)
# 调用定义的 get_boxes 静态方法获取关键点
boxs estimator.get_boxes(pred_dict[ fasterrcnn ], score_threshold 0.99)
# BGR转灰度图像
image_gray cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 合并单通道成多通道
image_dst cv2.merge([image_gray] * 3)
# 绘制掩膜
result_m draw_masks(image_dst, masks, color (0, 255, 0), alpha 0.5)
# 绘制预测框
result_b draw_body_box(img, boxs, thickness 3)
# 连接关键点
result_k draw_body_connections(img, keypoints, thickness 4, alpha 0.7)
# 绘制关键点
result_k draw_keypoints(result_k, keypoints, radius 5, alpha 0.8)
# 全部绘制在一张图上
result1 draw_body_box(result_m, boxs, thickness 3)
result draw_body_connections(result1, keypoints, thickness 4, alpha 0.7)
result draw_keypoints(result, keypoints, radius 5, alpha 0.8)
# 将参数元组的元素数组按水平方向及垂直方向进行叠加
# 预计显示结果如下示意 
# —————————————————————————————————
# | 原图 | 掩膜预测图 |
# —————————————————————————————————
# | 关键点及连接绘制图 | 预测框绘制图 |
# —————————————————————————————————
# 水平排列
image_h1 np.hstack((img, result_m))
image_h2 np.hstack((result_k, result_b))
# 垂直排列
image_v_and_h np.vstack((image_h1, image_h2))
# 展现单图结果
cv2.imshow( Image Separate Show , image_v_and_h)
cv2.imshow( Image Total Show , result)
cv2.waitKey(0)
cv2.destroyAllWindows()

欢迎大家交流评论一起学习希望本文能帮助您解决您在这方面遇到的问题感谢阅读
END

「深度学习一遍过」必修27：基于Mask

Python相关栏目本月热门文章