python+opencv+多线程推理图片不生效没有并行执行

需求：工业相机拍摄一张图片里有64个相同的小物体，检查每个小物体的缺陷，一张图片像素有2500万太大不能直接推理会超内存，拆小图用多线程推理。
实现方案：
使用python+opencv+缺陷推理模型，先根据一个小物体进行模板匹配和切图得到64张小图，
将64小图进行分组，每组8张图片，一共8组，使用多线程池，开了8个多线程，每个线程提交每组8张图片进行推理
遇到的问题：发现运行程序卡住不动或者推理耗时很久要128秒或者随着增加多线程8->16会增加耗时
分析：单独使用小图推理仅仅需要0.18秒左右，理论来说8张小图*0.18=1.44秒耗时
硬件：使用cpu推理
备注：多线程仅做推理，没有做别的操作
尝试：
1、在调用传图片推理那行代码加锁，运行卡住问题解决了，但是线程数4和线程1的总耗时都是64x0.18=12秒左右，多线程不起作用没有并行执行推理
2、修改多进程推理复现运行卡住问题
求帮忙分析下给出原因或者建议，谢谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
紫雾凌寒新星创作者: 人工智能技术领域 2026-01-05 22:15
关注
让 “紫雾凌寒” 来帮你回答,本回答结合 DeepSeek

如果还有问题，请评论或点击头像私信，如果有帮助到您, 请关注、采纳、点赞

关键点分析：
- 主要问题是在使用Python、OpenCV和多线程进行图片推理时，没有实现并行执行，即多线程没有起到加速推理小图的作用。
- 涉及到如何将大图片合理拆分成小图，以及如何使用多线程对小图进行并行推理，同时要考虑内存使用避免超内存。

解决方案：
- 拆分图片：
```python
import cv2

def split_image(image, num_splits):
height, width = image.shape[:2]
sub_height = height // num_splits
sub_images = []
for i in range(num_splits):
y_start = i * sub_height
y_end = (i + 1) * sub_height if i < num_splits - 1 else height
sub_image = image[y_start:y_end, :]
sub_images.append(sub_image)
return sub_images
- **多线程推理**：python
import threading
from concurrent.futures import ThreadPoolExecutor

def infer_sub_image(sub_image, model):
# 这里假设model是你的缺陷推理模型，进行具体的推理操作
# 例如：result = model.predict(sub_image)
# 这里简单返回一个固定值模拟推理结果，表示推理成功
return True

def multi_thread_inference(images, model):
num_threads = len(images)
results = []
with ThreadPoolExecutor(max_workers=num_threads) as executor:
for image in images:
future = executor.submit(infer_sub_image, image, model)
results.append(future)
final_results = [result.result() for result in results]
return final_results
- **完整示例**：python
# 读取大图片
big_image = cv2.imread(‘big_image.jpg’)
num_splits = 64
sub_images = split_image(big_image, num_splits)
# 假设这里有一个简单的模型对象model
model = None
results = multi_thread_inference(sub_images, model)
`` 3. 多种解决方案优缺点： - **使用concurrent.futures模块的ThreadPoolExecutor**： - **优点**： - 简单易用，通过submit方法提交任务，result方法获取结果，代码结构清晰。 - 可以方便地控制线程池大小，避免创建过多线程导致资源浪费。 - **缺点**： - 对于复杂的任务依赖关系处理能力有限，如果推理任务之间有先后顺序等关系，不太容易实现。 - **使用threading模块**： - **优点**： - 底层模块，对线程的控制更加灵活，可以更细粒度地管理线程生命周期等。 - **缺点**： - 代码相对复杂，需要手动管理线程的创建、启动、同步等操作，容易出错。例如需要手动处理线程锁等问题，如果忘记处理可能导致数据竞争等错误。 4. 总结：通过上述方法，先将大图片拆分成小图，然后利用多线程对小图进行并行推理，能够有效避免直接处理大图片超内存的问题，实现多线程加速推理。在实际应用中，根据具体的推理模型和需求，可能需要对推理函数infer_sub_image`进行更详细的实现，以得到准确的缺陷检查结果。

希望以上解答对您有所帮助。如果您有任何疑问，欢迎在评论区提出。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【CV-CUDA实战】使用Python+TensorRT+CVCUDA优化YOLOv8
2024-05-05 23:03

Day(AKA Elin)的博客目录什么是CV-CUDA 环境准备准备CV-CUDA静态库解压添加至变量将PyBind静态库复制到env下算子设计前...在C++上，这或许比较理想，我们可以使用OpenMP来借助多线程优化这个过程。可是现在的情况是Python，受限于...
OPENCV_DISABLE_THREADING PyTorch 入门教程:下载、安装、配置、参数简介、OPENCV_DISABLE_THREADING 参数解析与用法合集（2025 最新版）
2025-05-26 23:39

猫头虎的博客 PyTorch 入门、PyTorch 下载与安装、PyTorch GPU 环境配置、CUDA 12.8、cuDNN 9、Python 3.11、深度学习框架对比、OpenCV 多线程死锁、OPENCV_DISABLE_THREADING、cv2.setNumThreads(0)、OPENCV_FOR_THREADS_NUM、...
Python开发从入门到精通(上) - 基础编程
2025-01-16 09:39

莲华君的博客本书致力于让读者通过阅读、学习及实践成为Python大师。我们从“Hello, World！”开始，一步一步走向精通Python的道路。在这趟旅程中，你将已经不再是新手，而将成为拥有Python的核心技能的大师，这趟通往未来的旅程...
YOLO-v8.3部署教程：多GPU并行推理的配置与性能评估
2026-01-16 00:35

Neo-ke的博客本文介绍了基于星图GPU平台自动化部署Yolo-v8.3镜像的完整流程，重点实现多GPU并行推理配置与性能优化。该方案适用于高吞吐图像分析场景，如安防监控与遥感识别，显著提升目标检测效率，支持开箱即用的模型微调与AI...
Ubuntu升级opencv版本至4.9.0
2025-12-22 22:05

Norach的博客本文记录了在Ubuntu 22.04 LTS系统上从源码编译升级OpenCV至4.9.0版本的过程。由于系统自带官方仓库的...最后通过多线程编译完成安装。整个过程注重解决实际遇到的坑点，为需要升级OpenCV版本的用户提供了实用参考。
高并发OCR场景设计：负载均衡+多实例部署方案
2026-01-09 08:42

乾泽的博客本文围绕基于 CRNN 模型的轻量级 OCR 服务，构建了一套面向高并发场景的负载均衡 + 多实例部署方案性能提升：QPS 从 4.2 提升至 11.3，响应时间下降超 50%高可用保障：单点故障不影响整体服务弹性扩展：支持按需增减...
YOLOv8【第九章：模型部署篇·第13节】一文搞懂，多模型集成部署！
2025-12-12 16:21

bug菌¹的博客 requirements.txt fastapi==0.115.5 uvicorn==0.30.6 pydantic==2.9.2 ultralytics==8.3.34 numpy==1.26.4 opencv-python==4.10.0.84 prometheus-client==0.21.0 安装：pip install -r requirements.txt（建议 ...
AI推理卡/ModelArts
2022-12-08 16:09

元气少女缘结神的博客 #我的需求：x86上Nvidia显卡训练好的模型用在AI推理卡上，host端运行C++主程序device端的AI推理卡提供NN算力，进行推理##
HyperLPR3多线程优化：并发场景下的识别效率提升策略
2025-09-10 06:14

谭凌岭Fourth的博客在智能交通系统、停车场管理和道路监控等实际应用...本文将从Python和C++两个层面，系统分析HyperLPR3的多线程优化策略，通过任务并行、资源池化和锁机制等技术手段，实现并发场景下识别效率的显著提升。 ## Hyp...
[嵌入式AI从0开始到入土]14_orangepi_aipro小修补含yolov7多线程案例
2024-02-15 22:07

工具人呵呵的博客第9期转化为昇腾支持的om离线模型第10期 jupyter lab的使用第11期 yolov5在昇腾上推理第12期 yolov5在昇腾上应用第13期_orangepi aipro开箱测评第14期 orangepi_aipro小修补含yolov7多线程案例未完待续… ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月5日

python+opencv+多线程推理图片不生效没有并行执行

3条回答 默认 最新

问题事件

3条回答默认最新