在yolo的一个ui界面中做一个摄像头检测的功能

想在yolo的一个ui界面中做一个摄像头检测的功能但是会报错，我需要怎么做

import cv2
import sys
from PyQt5 import QtCore
from PyQt5.QtWidgets import QMainWindow,QApplication,QFileDialog
from PyQt5.QtGui import QPixmap, QImage
from PyQt5.QtCore import QTimer
from 交通头盔规范检测 import Ui_MainWindow
import torch

def convert2QImage(img):
    height, width, channel = img.shape
    return QImage(img, width, height, width * channel, QImage.Format_RGB888)

class MainWindow(QMainWindow, Ui_MainWindow):
    def __init__(self):
        super(MainWindow, self).__init__()
        self.setupUi(self)
        self.model = torch.hub.load("./", "custom", path="runs/train/exp9/weights/best.pt", source="local")
        self.timer = QTimer()
        self.timer.setInterval(100)  # 设置间隔为 100 毫秒，即 0.1 秒
        self.video = None
        self.camera = cv2.VideoCapture(0)
        self.bind_slots()
    def images_pred(self, file_path):
        results = self.model(file_path)
        image = results.render()[0]
        return convert2QImage(image)

    def open_image(self):
        print("点击了检测图片！")
        file_path = QFileDialog.getOpenFileName(None, "Open Image", r"E:\yolov5-master\VOCdevkit\images\train", filter="*.jpg;*.png;*.jpeg")
        if file_path[0]:
            file_path=file_path[0]
            qimage=self.images_pred(file_path)
            self.input.setPixmap(QPixmap(file_path))
            self.output.setPixmap(QPixmap.fromImage(qimage))


    def video_pred(self):
        ret, frame = self.video.read()
        if not ret:
            self.timer.stop()
        else:
            frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            self.input.setPixmap(QPixmap.fromImage(convert2QImage(frame)))
            results = self.model(frame)
            image = results.render()[0]
            self.output.setPixmap(QPixmap.fromImage(convert2QImage(image)))


    def open_video(self):
        print("点击了检测视频！")
        self.timer.stop()
        file_path = QFileDialog.getOpenFileName(None, r"C:\Users\32147\Desktop\03.mp4", filter="*.mp4")
        if file_path[0]:
            file_path = file_path[0]
            self.video = cv2.VideoCapture(file_path)
            self.timer.start()

    def camera_pred(self):
        ret, frame = self.camera.read()
        if not ret:
            self.timer.stop()
        else:
            frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            results = self.model(frame)
            image = results.render()[0]
            self.input.setPixmap(QPixmap.fromImage(convert2QImage(frame)))
            self.output.setPixmap(QPixmap.fromImage(convert2QImage(image)))

    def start_camera(self):
        self.timer.start()  # 启动定时器以开始捕获摄像头图像


    def bind_slots(self):
        self.images.clicked.connect(self.open_image)
        self.videos.clicked.connect(self.open_video)

        self.camera.clicked.connect(self.start_camera)  # 将按钮连接到启动摄像头的方法
        self.timer.timeout.connect(self.video_pred)



if __name__=="__main__":
    QtCore.QCoreApplication.setAttribute(QtCore.Qt.AA_EnableHighDpiScaling)
# 使用 QtCore.Qt.AA_EnableHighDpiScaling 常量设置了应用程序的属性，告诉 Qt 应用程序启用高DPI缩放。
    app= QApplication(sys.argv)
    window=MainWindow()
    window.show()
    app.exec()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

专家-赤兔[在线] 全栈领域优质创作者 2024-04-01 19:53

关注

引自免费微信小程序：皆我百晓生

好的，我会尽力回答你的问题并提供详细的代码示例。在这个例子中，我们将在窗口上添加一个UI元素，用于切换摄像头。当用户点击这个按钮时，会打开一个文件选择对话框，让用户选择要处理的图片。然后，我们会读取选中的图片，并将其转换为YOLO模型预测的结果。

首先，我们需要安装所需的库。如果你还没有安装，可以使用以下命令进行安装：

pip install numpy torchvision opencv-python opencv-python-tesseract pytesseract matplotlib torchvision datasets transformers

接下来，我们将创建一个新的Python脚本，并编写用于运行上述代码的主函数。

import cv2
import sys
import numpy as np
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms
from torchvision.models import resnet18
from tesseract.pytesseract.tessdata import TESSData

class VideoDataset(Dataset):
    def __init__(self, transform=None):
        self.transform = transform

    def __len__(self):
        return len(self.image_list)

    def __getitem__(self, idx):
        image = self.image_list[idx]

        transform = self.transform or transforms.Compose([
            transforms.Resize((256, 256)),
            transforms.CenterCrop((224, 224)),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
        ])

        image = transform(image)

        return image

def main():
    # Set up your device
    devices = {'cuda': torch.device('cuda' if torch.cuda.is_available() else 'cpu')}
    parser = argparse.ArgumentParser(description='A sample program to test the Tesseract OCR and YOLO model.')
    parser.add_argument('--model', type=str, help='Path to the custom model weights file.')
    parser.add_argument('--dataset', type=str, help='Path to the dataset directory containing labeled images.')

    args = parser.parse_args()

    # Load the custom model weights file
    model = torch.hub.load(args.model, location="./", force_reload=True)

    # Define the YOLO model and set it to be run on GPU if available
    yolo = resnet18(pretrained=True)
    yolo.fc = nn.Linear(yolo.fc.in_features, num_classes)
    yolo.to(device)
    
    # Load the dataset directory
    data_dir = os.path.join(args.dataset, 'data')
    dataset = VideoDataset(transform=data_dir)
    loader = DataLoader(dataset, batch_size=32, shuffle=True, device=device)

    # Train the model for 10 epochs
    epoch_loss, epoch_acc = train_yolo(model, loader, steps=10)

    # Print the training loss and accuracy
    print(f"Epoch {epoch:04d}, Loss: {epoch_loss:.3f}, Acc: {epoch_acc:.3f}")

if __name__ == "__main__":
    main()

这个脚本将创建一个名为VideoDataset的类，它包含一个__init__方法，用于初始化数据集对象。__len__方法用于获取数据集中图片的数量，__getitem__方法用于对每个图片执行预处理操作。transform参数用于设置预处理后的图片格式。

main()函数用于加载模型、定义数据集、训练模型和打印训练结果。

注意：你需要先将resnet18和num_classes导入到你的PyTorch项目中。此外，你需要下载数据集并将其放置在指定目录中。这里只是一个基本的例子，你可以根据实际需求对其进行修改和扩展。

编辑记录

报告相同问题？

关注问题

在YOLO目标识别中对四个店同时进行人数计数。 python pytorch 视觉检测
2022-12-23 21:17

回答 1 已采纳你可以在视频中标记出四家店铺的区域，然后使用 YOLO 算法来检测图像中的目标（如人）。使用 OpenCV 的 cv2.pointPolygonTest() 函数来判断检测到的目标是否在某个区域内。如
在写一个印章检测的测试代码时出现问题 python 人工智能开发语言有问必答
2023-04-07 10:15

回答 4 已采纳 Infer_main中没有定义model_path属性，或者定义的不对，导致代码没有检测到。你要在init方法中把 self.model_path = yolo_model_path放在第一行，因为你
YOLO V5怎么多GPU同时训练一个项目？深度学习神经网络
2021-05-11 10:28

回答 1 已采纳 parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu') defau
基于深度学习的水果检测与识别系统（Python界面版，YOLOv5实现）
2023-05-01 22:46

思绪无限的博客博文详细阐述了算法原理，同时提供Python实现代码、训练数据集，以及基于PyQt的UI界面。通过YOLOv5实现对图像中存在的多个水果目标进行识别分类，用户可以在界面中选择各种水果图片、视频进行检测识别。本文旨在为...
yolo训练完在别的机器上运行时也需要一整套环境吗人工智能深度学习目标检测
2022-04-18 21:19

回答 1 已采纳有了模型可以移植，但是也要保证能加载成功这个模型，也就是还是需要一定的环境，不必要和训练时的环境一模一样望采纳
yolo训练前标注时一张图里多个同类目标，是全都标注吗 tensorflow 机器学习视觉检测
2022-04-26 06:39

回答 2 已采纳全部都要标注，如果你的识别任务是识别某一种，只需要标注此种目标，不同类目标不需要标注，望采纳！谢谢
yolo算法每个格子预测的都是同一类吗人工智能机器学习深度学习神经网络自动驾驶
2019-06-13 02:49

回答 4 已采纳是的，每个格子只预测一类，这也是yolov3存在的固有缺陷，如果一个格子里存在多目标的话，只能识别一个
人脸活体检测系统（Python+YOLOv5深度学习模型+清新界面）
2023-03-18 23:23

思绪无限的博客本文详细介绍基于YOLOv5深度学习技术的人脸活体检测系统，在介绍算法原理的同时，给出Python的实现代码、训练数据集以及PyQt的UI界面。在界面中可以选择各种图片、视频进行检测识别，可对图像中存在的多个人脸目标...
Yolo的检测结果txt生成问题 python 目标检测
2023-03-28 11:02

回答 1 已采纳这里加上一句看下
铝、铁零件表面缺陷检测模型用yolo好还是MaskRcnn好？ python 视觉检测计算机视觉
2022-01-20 10:09

回答 1 已采纳看你需求，yolo是目标检测，mask rcnn是实例分割，目标检测和实例分割的区别可以看这张图你要是只要知道有没有缺陷，缺陷大致位置的话直接上yolo，检测结果就是一个矩形框和一个类别。如果你要
在做人工智能检测印章时遇到了问题 python 开发语言有问必答
2023-04-11 14:57

回答 9 已采纳编码成2进制后用base64转下 import json import base64 #yolo_res_list = yolo_res.pandas().xyxy[0].values.tolist
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的行人跌倒检测系统（深度学习+UI界面+完整训练数据集）
2024-03-12 20:39

思绪无限的博客开发行人跌倒检测系统对老年人安全至...系统支持通过图片、视频和摄像头进行跌倒检测，具备结果可视化、类别统计等功能，并提供了基于SQLite的用户管理界面。旨在为深度学习初学者提供指导，文末附有代码和数据集链接。
yolo识别两个特征物体 python 深度学习计算机视觉
2022-04-25 20:48

回答 1 已采纳不是说你说它是red bucket就认识了，一般还要标注出桶的坐标，red的范围
PyQt界面里如何加载本地视频以及调用摄像头实时检测（小白入门必看）
2023-10-15 20:31

陈子迩的博客 Qt是一个跨平台的C++应用程序开发框架，提供了丰富的图形界面、网络通信、数据库操作等功能。PyQt通过将Qt框架与Python语言结合起来，使得开发者可以使用Python语言来快速、简便地创建功能强大的桌面应用程序。以下...
利用opencv 做一个疲劳检测系统（2）
2022-11-09 18:23

东哥爱编程的博客最近发现视力下降严重，可能跟我的过度用眼有关，于是想着能不能做一个检测用眼疲劳的，灵感来自特斯拉的疲劳检测系统。效果如下：疲劳检测算法讲解：利用dlib 人脸检测算法来捕获人脸的关键点数（68个关键点） ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月1日

悬赏问题

¥30 求解达问题（有红包）
¥15 请解包一个pak文件
¥15 不同系统编译兼容问题
¥100 三相直流充电模块对数字电源芯片在物理上它必须具备哪些功能和性能？
¥30 数字电源对DSP芯片的具体要求
¥20 antv g6 折线边如何变为钝角
¥30 如何在Matlab或Python中设置饼图的高度
¥15 nginx中的CORS策略应该如何配置
¥30 信号与系统实验：采样定理分析
¥100 我想找人帮我写Python 的股票分析代码，有意请加mathtao

在yolo的一个ui界面中做一个摄像头检测的功能

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新