实用 OpenCV Python：图像处理示例

简介

在当今技术驱动的世界中，图像处理已成为许多领域不可或缺的一部分，从医学成像到自动驾驶，再到增强现实。OpenCV（开源计算机视觉库）是一个功能强大的库，它提供了数百种计算机视觉和机器学习算法。它最初用C++开发，但现在也支持Python、Java等接口。

Python以其简洁的语法和丰富的生态系统，成为了学习和应用OpenCV的理想选择。本文将深入探讨如何使用Python和OpenCV进行实用的图像处理，并通过具体的代码示例来展示其核心功能。

为什么选择 OpenCV Python？

功能强大：OpenCV包含了从基础图像操作到高级机器学习算法的广泛功能。
易于学习和使用：Python接口使得OpenCV的语法更加直观，降低了学习曲线。
社区活跃：拥有庞大而活跃的社区，提供了丰富的文档、教程和支持。
跨平台：可在Windows、Linux、macOS等多个操作系统上运行。
效率高：底层C++实现保证了性能，而Python接口则提供了开发效率。

环境准备

在开始之前，请确保你已经安装了Python。然后，可以通过pip安装OpenCV：

bash pip install opencv-python numpy matplotlib

numpy 用于处理图像数据（图像在OpenCV中通常表示为NumPy数组），matplotlib 用于方便地显示图像。

核心概念与基本操作

1. 加载、显示与保存图像

“`python
import cv2
import matplotlib.pyplot as plt
import numpy as np

加载图像

0表示加载灰度图像，1表示加载彩色图像，-1表示加载包括Alpha通道的原始图像

img_path = ‘test.jpg’ # 确保此路径下有图片
img = cv2.imread(img_path)

检查图像是否成功加载

if img is None:
print(f”错误: 无法加载图像 {img_path}”)
else:
# OpenCV默认使用BGR通道顺序，Matplotlib使用RGB，所以需要转换
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 显示图像
plt.imshow(img_rgb)
plt.title('原始图像')
plt.axis('off') # 不显示坐标轴
plt.show()

# 保存图像
cv2.imwrite('output_image.jpg', img)
print("图像已保存为 output_image.jpg")

“`

2. 图像属性

图像在OpenCV中是NumPy数组，因此你可以像操作NumPy数组一样获取其属性：

python if img is not None: print(f"图像尺寸 (高, 宽, 通道): {img.shape}") # (height, width, channels) print(f"图像像素总数: {img.size}") # height * width * channels print(f"图像数据类型: {img.dtype}") # 例如: uint8

3. 灰度转换

将彩色图像转换为灰度图像是许多图像处理任务的第一步。

“`python
if img is not None:
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

plt.imshow(gray_img, cmap='gray')
plt.title('灰度图像')
plt.axis('off')
plt.show()

“`

4. 图像缩放与裁剪

“`python
if img is not None:
# 缩放图像
resized_img = cv2.resize(img, (200, 300)) # (宽度, 高度)
# 或者按比例缩放
scale_percent = 50 # 50%
width = int(img.shape[1] * scale_percent / 100)
height = int(img.shape[0] * scale_percent / 100)
dim = (width, height)
resized_img_ratio = cv2.resize(img, dim, interpolation = cv2.INTER_AREA)

# 裁剪图像 (通过NumPy数组切片)
# [y_start:y_end, x_start:x_end]
cropped_img = img[50:200, 100:350] # 裁剪从行50到200，列100到350的区域

plt.figure(figsize=(10, 5))
plt.subplot(1, 3, 1)
plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.title('原始图像')
plt.axis('off')

plt.subplot(1, 3, 2)
plt.imshow(cv2.cvtColor(resized_img, cv2.COLOR_BGR2RGB))
plt.title('缩放图像 (200x300)')
plt.axis('off')

plt.subplot(1, 3, 3)
plt.imshow(cv2.cvtColor(cropped_img, cv2.COLOR_BGR2RGB))
plt.title('裁剪图像')
plt.axis('off')
plt.show()

“`

实用图像处理示例

1. 图像平滑/模糊

图像模糊是降低图像噪声的常用技术。

“`python
if img is not None:
# 高斯模糊 (Gaussian Blur)
# (5, 5) 是高斯核的大小，0 是X和Y方向的标准差
gaussian_blur = cv2.GaussianBlur(img, (5, 5), 0)

# 中值模糊 (Median Blur) - 对椒盐噪声效果好
# 5 是核的大小，必须是奇数
median_blur = cv2.medianBlur(img, 5)

plt.figure(figsize=(10, 5))
plt.subplot(1, 3, 1)
plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.title('原始图像')
plt.axis('off')

plt.subplot(1, 3, 2)
plt.imshow(cv2.cvtColor(gaussian_blur, cv2.COLOR_BGR2RGB))
plt.title('高斯模糊')
plt.axis('off')

plt.subplot(1, 3, 3)
plt.imshow(cv2.cvtColor(median_blur, cv2.COLOR_BGR2RGB))
plt.title('中值模糊')
plt.axis('off')
plt.show()

“`

2. 边缘检测 (Canny)

Canny边缘检测是一种流行的边缘检测算法，它是一个多阶段算法，能够检测到图像中广泛的边缘。

“`python
if img is not None:
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Canny(图像, 最小阈值, 最大阈值)
edges = cv2.Canny(gray_img, 100, 200)

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.imshow(gray_img, cmap='gray')
plt.title('灰度图像')
plt.axis('off')

plt.subplot(1, 2, 2)
plt.imshow(edges, cmap='gray')
plt.title('Canny 边缘检测')
plt.axis('off')
plt.show()

“`

3. 图像阈值化 (Thresholding)

图像阈值化是一种将灰度图像转换为二值图像（只有黑白两种颜色）的简单而有效的方法。

“`python
if img is not None:
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 简单阈值化
# cv2.THRESH_BINARY: 大于阈值设为maxval，否则设为0
# cv2.THRESH_BINARY_INV: 小于阈值设为maxval，否则设为0
ret, thresh1 = cv2.threshold(gray_img, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(gray_img, 127, 255, cv2.THRESH_BINARY_INV)

# 自适应阈值化 (对光照不均的图像效果更好)
# cv2.ADAPTIVE_THRESH_GAUSSIAN_C: 加权均值
# cv2.ADAPTIVE_THRESH_MEAN_C: 均值
# 11是块大小 (用于计算阈值的邻域大小)，2是常量C (从均值或加权均值中减去的值)
adaptive_thresh_mean = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
adaptive_thresh_gaussian = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)

plt.figure(figsize=(12, 8))
plt.subplot(2, 3, 1)
plt.imshow(gray_img, cmap='gray')
plt.title('灰度图像')
plt.axis('off')

plt.subplot(2, 3, 2)
plt.imshow(thresh1, cmap='gray')
plt.title('二值阈值化')
plt.axis('off')

plt.subplot(2, 3, 3)
plt.imshow(thresh2, cmap='gray')
plt.title('反向二值阈值化')
plt.axis('off')

plt.subplot(2, 3, 4)
plt.imshow(adaptive_thresh_mean, cmap='gray')
plt.title('自适应均值阈值化')
plt.axis('off')

plt.subplot(2, 3, 5)
plt.imshow(adaptive_thresh_gaussian, cmap='gray')
plt.title('自适应高斯阈值化')
plt.axis('off')
plt.show()

“`

4. 轮廓检测与绘制

轮廓是连接所有连续点（沿边界）的曲线，具有相同的颜色或强度。轮廓在形状分析、对象检测和识别中非常有用。

“`python
if img is not None:
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 先进行阈值化或Canny边缘检测以获得二值图像
ret, thresh = cv2.threshold(gray_img, 127, 255, cv2.THRESH_BINARY)

# 寻找轮廓
# cv2.RETR_EXTERNAL: 只检测最外层轮廓
# cv2.CHAIN_APPROX_SIMPLE: 压缩水平、垂直和对角线段，只保留它们的端点
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 绘制轮廓
# -1表示绘制所有轮廓，(0, 255, 0)是颜色 (绿色), 3是线宽
img_contours = img.copy()
cv2.drawContours(img_contours, contours, -1, (0, 255, 0), 3)

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.imshow(thresh, cmap='gray')
plt.title('二值图像')
plt.axis('off')

plt.subplot(1, 2, 2)
plt.imshow(cv2.cvtColor(img_contours, cv2.COLOR_BGR2RGB))
plt.title(f'检测到的轮廓 ({len(contours)} 个)')
plt.axis('off')
plt.show()

“`

5. 颜色空间转换 (RGB to HSV)

除了BGR（或RGB）颜色空间，OpenCV还支持其他颜色空间，如HSV（色相、饱和度、亮度）。HSV颜色空间在基于颜色的对象检测中特别有用。

“`python
if img is not None:
# 转换为HSV颜色空间
hsv_img = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

# 分离H, S, V通道 (可选)
h, s, v = cv2.split(hsv_img)

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.title('原始图像 (BGR)')
plt.axis('off')

plt.subplot(1, 2, 2)
# 对于HSV图像显示，通常需要先转换回BGR再转RGB
plt.imshow(cv2.cvtColor(hsv_img, cv2.COLOR_HSV2RGB))
plt.title('HSV 图像')
plt.axis('off')
plt.show()

# 例如，根据颜色范围进行对象检测 (绿色)
# 注意：OpenCV的H值范围是0-179，S和V是0-255
lower_green = np.array([35, 100, 100])
upper_green = np.array([85, 255, 255])
mask = cv2.inRange(hsv_img, lower_green, upper_green)

res = cv2.bitwise_and(img, img, mask=mask)

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.imshow(mask, cmap='gray')
plt.title('绿色掩码')
plt.axis('off')

plt.subplot(1, 2, 2)
plt.imshow(cv2.cvtColor(res, cv2.COLOR_BGR2RGB))
plt.title('提取绿色区域')
plt.axis('off')
plt.show()

“`

总结

本文介绍了如何使用Python和OpenCV进行基本的图像加载、显示、保存以及一系列实用的图像处理技术，包括灰度转换、缩放、裁剪、图像模糊、边缘检测、阈值化、轮廓检测和颜色空间转换。这些只是OpenCV强大功能的一小部分。通过掌握这些基础知识，你将能够进一步探索更高级的应用，如特征提取、对象识别、图像拼接、深度学习集成等。

OpenCV是一个不断发展的库，拥有丰富的资源和活跃的社区。鼓励读者查阅官方文档和各种在线教程，深入学习其更多的功能和应用场景。图像处理的旅程充满挑战和乐趣，OpenCV Python将是你探索这一领域的得力助手。

提示：在运行上述代码时，请确保将 img_path = 'test.jpg' 替换为你本地实际的图像文件路径。