带mask的图像如何使用yolo训练

使用yolo8进行图像分割，但是只有图像和对应的掩膜mask，不知道yolo怎么配置mask进行训练？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

码农阿豪@新空间代码工作室 Java领域优质创作者 2024-03-22 20:55

关注

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言

解答：在使用yolo8进行图像分割时，我们可以通过指定掩膜的路径，让yolo8加载掩膜，并在训练时将掩膜信息加入到相应的类别中。以下是配置yolo8进行图像分割的示例代码：

# 导入必要的库
import tensorflow as tf
from yolo8.model import Yolo8
from yolo8.loss import yolov4_loss
from yolo8.dataset import create_dataset
from yolo8.utils import load_yaml, load_weights
# 载入配置文件
config = load_yaml('config.yaml')
# 创建数据集
train_dataset = create_dataset(config['train_path'], config['batch_size'])
val_dataset = create_dataset(config['val_path'], config['batch_size'], is_training=False)
# 创建模型
model = Yolo8(config['num_classes'], config['anchors'], config['weights_path'])
model.summary()
# 编译模型
optimizer = tf.keras.optimizers.Adam(learning_rate=config['learning_rate'])
model.compile(loss=yolov4_loss(config), optimizer=optimizer, metrics=['accuracy'])
# 加载预训练权重
load_weights(model, config['weights_path'], 'yolo8')
# 训练模型
history = model.fit(train_dataset,
                    epochs=config['epochs'],
                    validation_data=val_dataset,
                    callbacks=[tf.keras.callbacks.TensorBoard(log_dir='./logs')])

在以上示例代码中，我们需要在配置文件中指定训练集存储路径、验证集存储路径、类别数、anchors信息、预训练权重路径等信息，具体可参考以下示例：

num_classes: 2
anchors:
  - [12, 16, 19, 36, 40, 28]
  - [36, 75, 76, 55, 72, 146]
  - [142, 110, 192, 243, 459, 401]
weights_path: 'yolo8_weights.h5'
batch_size: 16
epochs: 50
learning_rate: 0.001
train_path: '/path/to/train/data'
val_path: '/path/to/val/data'

在加载数据集时，我们需要从训练集中读取图像和掩膜，并将它们分别存储在x和y中，具体可参考以下示例：

def load_data(image_path, mask_path):
    image = tf.io.read_file(image_path)
    image = tf.image.decode_jpeg(image, channels=3)
    image = tf.image.resize(image, (448, 448)) / 255.0
    mask = tf.io.read_file(mask_path)
    mask = tf.image.decode_png(mask, channels=1)
    mask = tf.image.resize(mask, (448, 448)) / 255.0
    return image, mask
def create_dataset(data_path, batch_size, is_training=True):
    dataset = tf.data.Dataset.list_files(data_path)
    dataset = dataset.map(lambda x: tf.numpy_function(load_data, [x, x.numpy().decode().replace('.jpg', '.png')], [tf.float32, tf.float32]),
                          num_parallel_calls=tf.data.experimental.AUTOTUNE)
    if is_training:
        dataset = dataset.shuffle(buffer_size=1000)
        dataset = dataset.repeat()
    dataset = dataset.batch(batch_size)
    dataset = dataset.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
    return dataset

以上示例中，load_data函数用于读取图像和掩膜，并标准化图像和掩膜的像素值；create_dataset函数用于创建数据集，并在训练时对数据进行shuffle和repeat操作。在加载模型时，我们需要指定掩膜的通道数为1，具体可参考以下示例：

def conv_bn_relu(x, filters, kernel_size, strides=1):
    x = tf.keras.layers.Conv2D(filters, kernel_size, strides=strides, padding='same', use_bias=False)(x)
    x = tf.keras.layers.BatchNormalization()(x)
    x = tf.keras.layers.ReLU()(x)
    return x
def upsample(x, size):
    return tf.image.resize(x, size, method='bilinear')
class Yolo8(tf.keras.models.Model):
    def __init__(self, num_classes, anchors, weights=None):
        super(Yolo8, self).__init__()
        self.num_classes = num_classes
        self.anchors = anchors
        self.backbone = tf.keras.applications.VGG16(include_top=False, weights=None)
        self.heads = [
            tf.keras.Sequential([
                conv_bn_relu(filters=508, kernel_size=3),
                tf.keras.layers.Conv2D(filters=len(anchors[i]) * (num_classes + 5), kernel_size=1, strides=1, padding='same')]) for i in range(3)]
        if weights is not None:
            load_weights(self, weights, 'yolo8')
    def call(self, inputs):
        x = self.backbone(inputs)
        y1 = self.heads[0](x)
        y2 = self.heads[1](x)
        y3 = self.heads[2](x)
        return [y1, y2, y3]
    def inference(self, inputs, conf_thresh=0.5, iou_thresh=0.5):
        outputs = self(inputs)
        results = []
        for i, output in enumerate(outputs):
            results.append(self.decode(output, self.anchors[i], self.num_classes, i, conf_thresh, iou_thresh))
        if len(results) > 1:
            return tf.concat(results, axis=1)
        return results[0]
    def decode(self, output, anchors, num_classes, level, conf_thresh, iou_thresh):
        grid_size = tf.shape(output)[1:3]
        num_anchors = len(anchors)
        box_raw = tf.reshape(output[:, :, :, :num_anchors * 5], [-1, grid_size[0] * grid_size[1], num_anchors, 5])
        class_raw = tf.reshape(output[:, :, :, num_anchors * 5:], [-1, grid_size[0] * grid_size[1], num_classes])
        box_xy = tf.sigmoid(box_raw[..., :2]) + tf.meshgrid(tf.range(grid_size[1]), tf.range(grid_size[0]))[::-1]
        box_wh = tf.exp(box_raw[..., 2:4]) * tf.cast(tf.expand_dims(tf.reshape(anchors, [1, 1, num_anchors, 2]), axis=2), tf.float32)
        box_conf = tf.sigmoid(box_raw[..., 4:5])
        class_prob = tf.nn.softmax(class_raw)
        box_xy /= tf.cast(tf.expand_dims(grid_size, axis=-1), tf.float32)
        box_wh /= tf.cast(tf.expand_dims(grid_size, axis=-1), tf.float32)
        box_min = box_xy - box_wh / 2
        box_max = box_xy + box_wh / 2
        boxes = tf.concat([box_min[..., :1], box_min[..., 1:2],
                           box_max[..., :1], box_max[..., 1:2]], axis=-1)
        scores = box_conf * class_prob
        scores = tf.reduce_max(scores, axis=-1)
        boxes, scores, classes, valid_detections = tf.image.combined_non_max_suppression(
            boxes=tf.expand_dims(boxes, axis=2),
            scores=tf.expand_dims(scores, axis=2),
            max_output_size_per_class=100,
            max_total_size=100,
            iou_threshold=iou_thresh,
            score_threshold=conf_thresh)
        classes = tf.squeeze(classes, axis=2)
        return tf.concat([boxes, scores[..., tf.newaxis], classes[..., tf.newaxis]], axis=-1)

在以上示例代码中，我们对原有的Yolo8模型进行了修改，使得它可以处理mask信息，并在训练时将掩膜信息加入到相应的类别中。参考文献： [1]https://github.com/hunglc007/tensorflow-yolov4-tflite [2]https://zhuanlan.zhihu.com/p/145680550

报告相同问题？

关注问题

请教一下 yolo 深度学习训练图像和推理图像大小的问题 python 人工智能有问必答深度学习
2021-09-24 11:36

回答 2 已采纳影响就是1920x1080的图片在保持长宽比缩放（注意是长边缩放到640，短边不够的用0填充)到640x640的情况下，你的目标不会变成太小，原本5x5大小的物体缩放之后变成一个像素点之类的那肯定就有
yolo训练完在别的机器上运行时也需要一整套环境吗人工智能深度学习目标检测
2022-04-18 21:19

回答 1 已采纳有了模型可以移植，但是也要保证能加载成功这个模型，也就是还是需要一定的环境，不必要和训练时的环境一模一样望采纳
铝、铁零件表面缺陷检测模型用yolo好还是MaskRcnn好？ python 视觉检测计算机视觉
2022-01-20 10:09

回答 1 已采纳看你需求，yolo是目标检测，mask rcnn是实例分割，目标检测和实例分割的区别可以看这张图你要是只要知道有没有缺陷，缺陷大致位置的话直接上yolo，检测结果就是一个矩形框和一个类别。如果你要
FACEMASK_YOLO-:面罩检测
2021-04-02 04:54

标题"FACEMASK_YOLO-"涉及的是一个利用YOLO（You Only Look Once）算法进行面罩检测的项目。...这些技术是现代计算机视觉和人工智能领域的重要组成部分，对于理解和实现高效、实用的面罩检测系统至关重要。
yolo训练时能不能使用之前训练出来的权重文件继续在新的数据集上训练？可以提高准确率吗 tensorflow 机器学习目标检测
2022-04-21 22:20

回答 2 已采纳一般来说用之前的权重文件当作预训练模型是有助于提高一些准确率的，前提条件是你的新数据对于旧数据集来说是新的数据分布（除非新数据和旧数据差不多，不然增加数据量可以增大数据分布区间的）
YOLO v5训练使用CPU正常，使用GPU训练 box cls obj均为nan pytorch 深度学习目标检测
2022-01-15 21:21

回答 2 已采纳解决了，既然锁定问题出在显卡上，在坚信不是硬件问题的前提下，只能一遍一遍换驱动版本。刚开始用的最早的驱动版本是11.3，pytorch支持的另一个cuda版本10.2 nvidia官网不支持wind
yolo训练完成300次后不收敛如何继续训练 python pytorch 计算机视觉
2022-04-29 21:16

回答 2 已采纳它报错300 轮已经完成 ?你把300改成500试试
OpenCV4.x图像处理实例-YOLO v8图像分割
2023-04-01 13:32

视觉&物联智能的博客在前面的文章中，我们使用YOLO v8模型实现了图像、视频流进行物体检测与识别。本文将详细介绍，如何使用YOLO v8进行物体检测与分割(Segmetation)。
求解！为什么使用yolo训练神经网络的时候图片会自动旋转？机器学习深度学习神经网络
2022-11-28 08:14

回答 2 已采纳 data/hyps/hpy.scartch.xxxx.yaml文件中有个fliplr这个超参数，不需要翻转的话改成0。如果改完之后还翻转，说明你改了增强了，utils/augmentations.py
跑yolo的时候gpu占用了为0 python 人工智能深度学习
2022-10-25 09:11

回答 2 已采纳显存沾满说明有调用，只不过瓶颈不在GPU，而是你的其他部分，也就是常说的木桶效应，比如你这个明显就是内存不足导致的。另外，很多人有个误解，说GPU使用率不高，是不是没调用，但是实际上这里显示的一般是平
yolo输入图像大分辨率小目标检测？人工智能
2021-07-29 16:06

回答 2 已采纳用滑动窗口，620x620大小,h和w步长可以设置成600（20像素重叠，用于保证物体完整），用窗口图片遍历全部大图检测，然后把结果加上窗口偏移值显示会原来的图片。
人工智能-Yolo学习资料.zip
2023-08-30 20:09

文档"人工智能-Yolo学习资料.docx"可能涵盖了YOLO的基本概念、工作原理、模型结构、训练过程、优化技巧以及在实际项目中的应用案例。【详细内容】: 1. **YOLO基本原理**：YOLO，全称为"You Only Look Once"，由...
yolo训练前标注时一张图里多个同类目标，是全都标注吗 tensorflow 机器学习视觉检测
2022-04-26 06:39

回答 2 已采纳全部都要标注，如果你的识别任务是识别某一种，只需要标注此种目标，不同类目标不需要标注，望采纳！谢谢
yolo系列目标检测模型训练结果分析
2024-04-12 15:15

Python图像识别的博客训练结果目录目标检测常用指标术语解释精度（Precision）在二分类问题中，精度是指被正确分类的正样本数量与所有被分类为正样本的样本数量之比。它衡量了分类器在预测为正样本时的准确性。召回率（Recall）在...
YOLO-MASK对图像数据集进行清洗
2020-05-06 17:00

pogg_的博客之前在捣鼓yolo系列模型，尝试着对coco的羊数据集进行训练，可是发现不管怎么调参，Map一直在60几，死活上不了70。后来在一位资深老算法师的指点下，才明白，精度很大程度取决于数据集，因此一直围绕着数据集进行...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月22日

悬赏问题

¥15 LLM accuracy检测
¥15 pycharm添加远程解释器报错
¥15 如何让子窗口鼠标滚动独立，不要传递消息给主窗口
¥15 如何能达到用ping0.cc检测成这样？如图
¥15 关于#DMA固件#的问题，请各位专家解答！
¥15 matlab生成的x1图不趋于稳定，之后的图像是稳定的水平线
¥15 请问华为OD岗位的内部职业发展通道都有哪些，以及各个级别晋升的要求
¥20 微信小程序 canvas 问题
¥15 系统 24h2 专业工作站版，浏览文件夹的图库，视频，图片之类的怎样删除？
¥15 怎么把512还原为520格式

带mask的图像如何使用yolo训练

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新