c++多线程模型速度问题

各位友友，现在我有一个c++程序，是跑模型的代码，现在的问题是我用一个初始化一个模型用一个线程跑速度在100ms，但是我初始化两个模型用两个模型并行计算的时候每个模型的速度就增加到了200ms，两个一起的化就差不多400-500ms了，这个问题怎么解决呢


#include "SamBox.h"
#include <opencv2/core/cuda.hpp>
#include <opencv2/opencv.hpp>

using namespace cv;
#include <regex>
#include <vector>
#include <thread>
#include <future>


// 找中心点
std::vector<cv::Point> find_center(cv::Mat img)
{
    std::vector<std::vector<cv::Point>> contours;
    std::vector<cv::Vec4i> hierarchy;
    cv::findContours(img, contours, hierarchy, cv::RETR_TREE, cv::CHAIN_APPROX_SIMPLE);

    std::vector<cv::Point> pointList;
    double area = 0;

    for (const auto &cnt : contours)
    {
        area = cv::contourArea(cnt);
        if (area > 9000)
        {
            cv::Moments M = cv::moments(cnt);
            int cX = static_cast<int>(M.m10 / M.m00);
            int cY = static_cast<int>(M.m01 / M.m00);
            pointList.push_back(cv::Point(cX, cY));
        }
    }
    return pointList;
}

void processImages(const std::vector<cv::String>& fileNames, SamBox* samBox) {
    cv::Mat blendedImage;
    cv::Mat mask; 
    for (const auto& filename : fileNames) {
        double iou;
        cv::Rect box_crop;  
        cv::Rect box_rect;    
        cv::Mat img = cv::imread(filename, -1);
        size_t pos0 = filename.find_last_of("/");
        std::string name = filename.substr(pos0+1);
        std::string inputStr = filename;
        int channels = img.channels();
        if (channels == 3)
        {
            cv::cvtColor(img, img, cv::COLOR_BGR2GRAY);
        }
        // 使用正则表达式匹配数字
        std::regex pattern(R"(\d+)");
        std::smatch matches;
        std::vector<std::string> numbers;

        // 从字符串中找到所有匹配的数字，并保存到vector中 
        while (std::regex_search(inputStr, matches, pattern)) {
            numbers.push_back(matches.str());
            inputStr = matches.suffix();
        }
        // 存储后面的四个匹配的数字
        int number1 = 0, number2 = 0, number3 = 0, number4 = 0;
        if (numbers.size() >= 4) {
            number1 = std::stoi(numbers[numbers.size() - 4]);
            number2 = std::stoi(numbers[numbers.size() - 3]);
            number3 = std::stoi(numbers[numbers.size() - 2]);
            number4 = std::stoi(numbers[numbers.size() - 1]);
        } else {
            std::cout << "Not enough numbers found.";
            
        }
        cv::Rect box = {number1,number2,number3,number4};
        auto start = std::chrono::high_resolution_clock::now(); 
        // 计算原始矩形框的中心点
        cv::Point center = cv::Point(box.x + box.width / 2, box.y + box.height / 2);
        // 计算新的矩形框的宽度和高度
        int newWidth = static_cast<int>(box.width * 2);
        int newHeight = static_cast<int>(box.height * 1.5);

        // 计算新的矩形框的左上角坐标
        int newX = center.x - newWidth / 2;
        int newY = center.y - newHeight / 2;
        cv::Mat image;
        box_crop = {newX, newY, newWidth, newHeight};
        bool flag;
        if( newX < 0 || newY < 0 || newWidth > img.size().width || newHeight > img.size().height ){
            image = img;
            flag = false;
            box_rect = {box.x,box.y,box.width,box.height};
        }
        else
        {
            image = img(box_crop);
            box_rect = {box.x-newX,box.y-newY,box.width,box.height};
            flag = true;
        }

        auto results = samBox->segmentImgs(image, box_rect);

        mask = results.first;
        iou = results.second;
        //将crop传入模型输出的mask还回原图尺寸大小
        if(flag){
            cv::Mat result_mask = cv::Mat::zeros(img.size(), img.type());
            mask.copyTo(result_mask(box_crop));
            mask = result_mask;
        }
        // 查找轮廓
        std::vector<std::vector<cv::Point>> contours;
        std::vector<cv::Vec4i> hierarchy;
        cv::findContours(mask, contours, hierarchy, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_SIMPLE);
        //在图像上绘制矩形框
        cv::rectangle(img,box.tl(),box.br(), cv::Scalar(0, 255, 0), 5);
        cv::drawContours(img, contours, -1, cv::Scalar(0, 0, 255), 5);
        cv::cvtColor(img, img, cv::COLOR_GRAY2BGR);
        auto end = std::chrono::high_resolution_clock::now();
        std::chrono::duration<double> duration = end - start;
        std::cout << "all_time_2: " << duration.count() << " seconds" << std::endl;
        cv::imwrite("/home/jacc/samC++/res_img/"+name, img);
        std::cout << "............................................" << std::endl;
    }
    // }
}



int main(int argc, char **argv)
{   
    std::string folderPath = "/home/jacc/samC++/img_tray/60/";
    std::string fileExtension = ".jpg";
    std::vector<cv::String> fileNames;
    cv::glob(folderPath + "*" + fileExtension, fileNames);

    std::string folderPath1 = "/home/jacc/samC++/img_tray/70/";
    std::string fileExtension1 = ".jpg";
    std::vector<cv::String> fileNames1;
    cv::glob(folderPath1 + "*" + fileExtension1, fileNames1);

    // 初始化两个模型
    SamBox* samBoxA = new SamBox();
    SamBox* samBoxB = new SamBox();
    samBoxA->initializeSam();
    samBoxB->initializeSam();
        
    // 启动两个线程并行处理不同类别的图像
    std::thread threadA(processImages, fileNames, samBoxA);
    std::thread threadB(processImages, fileNames1, samBoxB);

    // 等待两个线程完成
    threadA.join();
    threadB.join();

    // 释放模型资源
    delete samBoxA;
    delete samBoxB;
}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

11条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
前网易架构师-高司机优质创作者: 人工智能技术领域 2023-09-11 10:22
关注
你是几核CPU的？执行慢不一定是线程对CPU资源的抢占问题，你的是opencv加载和写文件，瓶颈可能在读写io上，建议你在读写资源前后打印下时间
另外你的并行运算使用的是那种库mpi？并行执行的效率比多线程的效率高，你的并行化相当于是2个进程在同时跑，有自己独立的地址空间，而多线程快也是需要一个合理的线程模型的，所以我想知道你是需要一个设计来提升执行多个processImages任务的效率，还是只是做测试看看多线程的效率？

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(10条)

报告相同问题？

关注问题

C++多线程编程指南[项目源码]
2025-11-12 17:06

本文详细介绍了C++多线程编程的各个方面，从基础到高级应用，强调了多线程编程在实际项目中的重要性和实施策略。首先，文章对线程的基础概念进行了阐述，这是构建多线程应用程序的前提。线程是操作系统能够进行...
yolov5目标检测多线程C++部署
2023-08-12 15:13

** yolov5目标检测多线程C++...总的来说，YOLOv5的C++多线程部署是一项综合了计算机视觉、深度学习、多线程编程和性能优化的复杂任务。理解这些知识点并灵活运用，能够帮助开发者构建出高效、可扩展的目标检测系统。
《C++11线程库：开启多线程编程新世界》
2025-10-22 11:58

内容概要：本文深入介绍了C++11线程库的核心组件及其在多线程编程中的应用，涵盖std::thread的创建、启动与等待，线程标识与管理，以及线程对象的移动语义；详细讲解了线程同步机制，包括互斥锁（std::mutex）、递归...
C_C++ 多线程编程精髓_专栏.rar
2020-05-26 10:13

由浅入深的介绍 linux windows下多线程程序设计，线程池模型设计，针对多线程编程，详细地介绍 Windows 和 Linux操作系统层面上提供的各种多线程接口，理解并熟悉它们的使用操作系统层面上关于多线程和多线程协作的...
构建高性能C++应用：并发编程与多线程处理-.md
2024-09-07 20:40

深入探讨了如何利用并发编程与多线程处理来构建高性能的C++应用。文章首先介绍了并发与并行的基本概念、线程与进程的区别，以及多线程的优势与挑战。接着，详细讲解了C++中支持并发编程的核心工具，包括`std::thread...
【C++异步编程】基于多线程与同步机制的高效软件开发：构建响应式高性能应用程序
2025-04-03 09:38

内容概要：本书《异步编程与C++》深入探讨了多线程和异步编程技术，旨在帮助开发者构建高效、响应迅速且高性能的软件。书中首先介绍了并行编程的基础概念和技术，包括各种并行编程范式及其性能评估指标。随后详细...
C++11多线程编程[项目源码]
2025-11-17 10:50

这些工具的引入大大提高了并发程序的开发效率，并使得C++在多线程编程方面的能力与其他现代编程语言看齐。通过熟悉并掌握这些工具，开发者可以编写出更加健壮和高效的多线程程序。此外，为了实现跨平台的优势，C++...
(源码)基于C++多线程框架的并发编程示例.zip
2025-04-21 03:46

本项目包含多个示例代码，用于展示C++多线程编程中的不同技术点，包括互斥锁（mutex）的使用、原子操作（atomic）、生产者消费者模型、异步任务（async）和单例模式（Singleton Pattern）等。这些示例代码旨在帮助...
Linux多线程服务端编程：使用muduo C++网络库
2019-02-13 00:13

本书主要讲述采用现代C++ 在x86-64 Linux 上编写多线程TCP 网络服务程序的主流常规技术，重点讲解一种适应性较强的多线程服务器的编程模型，即one loop per thread。这是在Linux 下以native 语言编写用户态高性能...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 9月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月11日
展开全部

c++多线程模型速度问题

11条回答 默认 最新

问题事件

11条回答默认最新