首页 > 文章 > python教程

Python图像识别：CNN与OpenCV实战教程

时间：2026-01-18 17:25:36 380浏览收藏

有志者，事竟成！如果你在学习文章，那么本文《Python图像识别教程：CNN与OpenCV实战案例》，就很适合你！文章讲解的知识点主要包括，若是你对本文感兴趣，或者是想搞懂其中某个知识点，就请你继续往下看吧~

OpenCV负责图像预处理与结果可视化，CNN（如ResNet50）负责特征提取与分类；二者分工明确：OpenCV处理读取、缩放、色彩转换、归一化，CNN加载预训练模型进行推理并解码预测结果。

Python图像识别教程_CNN与OpenCV结合实现案例

用Python做图像识别，CNN负责“看懂”图像内容，OpenCV负责“预处理+展示”，两者结合能快速搭建实用的识别系统。关键不是堆代码，而是理清分工：OpenCV管图像读写、缩放、灰度、边缘等操作，CNN（比如用TensorFlow/Keras或PyTorch）管特征提取和分类。

先确保安装核心库：

验证是否正常：运行 import cv2; print(cv2.__version__) 和 import tensorflow as tf; print(tf.__version__)，不报错即就绪。

CNN对输入敏感，原始图像常需标准化。OpenCV在这里承担清洗角色：

读取并统一尺寸：img = cv2.imread("cat.jpg"); img = cv2.resize(img, (224, 224))
通道转换（BGR→RGB）：img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)（因OpenCV默认BGR，而大多数CNN模型训练时用RGB）
归一化像素值：img = img.astype("float32") / 255.0
扩展维度适配模型输入：img = np.expand_dims(img, axis=0)（变成 (1, 224, 224, 3) 形状）

若处理摄像头实时流，可用 cv2.VideoCapture(0) + 循环读帧 + 上述流程，每帧送入CNN推理。

不用从头训练，直接调用Keras内置模型更高效：

加载带权重的模型：from tensorflow.keras.applications import ResNet50; model = ResNet50(weights="imagenet")
预测：preds = model.predict(img)
解码结果：from tensorflow.keras.applications.resnet50 import decode_predictions; results = decode_predictions(preds, top=3)[0]
打印识别结果：for (i, (imagenetID, label, prob)) in enumerate(results): print(f"{i+1}. {label}: {prob:.2f}")

注意：若自定义CNN（如用Sequential搭建），需确保输入层shape与OpenCV预处理后一致，并用 model.load_weights() 加载训练好的权重。

把CNN输出的文字信息“画”回图像，便于直观验证：

将归一化前的原图（RGB格式）转为BGR供OpenCV绘图：display_img = cv2.cvtColor(original_rgb, cv2.COLOR_RGB2BGR)
用 cv2.putText() 添加文字，例如：cv2.putText(display_img, f"{label}: {prob:.2f}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0,255,0), 2)
显示结果：cv2.imshow("Recognition", display_img); cv2.waitKey(0); cv2.destroyAllWindows()

进阶可加矩形框标出目标区域（需目标检测模型如YOLO或SSD配合），但纯图像分类任务中，文字标注已足够清晰反馈。

到这里，我们也就讲完了《Python图像识别：CNN与OpenCV实战教程》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于的知识点！