二进制掩码转目标检测标签

已知文件夹A内存放有若干张二进制掩码滑坡图片，每一张滑坡二进制掩码图片内部有多个滑坡体（数值非0且每个滑坡体均为一个封闭多边形）求如何利用代码在pycharm软件中求得A文件夹内的二进制掩码图片中的多个滑坡体的数据标签用于记录滑坡体的最小外接矩形的坐标情况（VOC格式，应该包括每个滑坡体的最小外接矩形的坐标情况）最后以xml文档的形式存储(每个xml对应相应的二进制掩码图片图片)，最后将所有xml文档放入文件夹B.

上图便是四个滑坡体二进制掩码拼接图片，如何获得相应的目标检测标签呢？
2、如何利用代码将文件夹A内的若干滑坡图片每四张滑坡图片为一组拼接在一起并确保最后的拼接结果为一矩
形，将拼接的图片放入文件夹B

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

Leodong. 2023-04-09 17:02

关注

该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下：
以下是完整的回答：

1、二进制掩码转目标检测标签

可以使用Python中的OpenCV库来读取二进制掩码图片，并使用Contour Detection算法来获取滑坡体的边界框信息。具体步骤如下：

1）. 导入OpenCV库和xml.etree.ElementTree库

import cv2
import xml.etree.ElementTree as ET

2）. 定义函数来获取滑坡体的边界框信息

def get_bounding_boxes(mask):
    # 使用Contour Detection算法获取滑坡体的边界框信息
    contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # 遍历每个滑坡体，获取其最小外接矩形的坐标信息
    boxes = []
    for contour in contours:
        x, y, w, h = cv2.boundingRect(contour)
        boxes.append((x, y, x+w, y+h))  # VOC格式中的坐标是左上角和右下角的点

    return boxes

3）. 遍历文件夹A下的所有二进制掩码图片，并为每个滑坡体创建一个XML文件

import os

# 文件夹A的路径
dir_path = 'A/'

# 遍历文件夹A下的所有二进制掩码图片
for filename in os.listdir(dir_path):
    if filename.endswith('.png'):  # 假设所有二进制掩码图片的格式为png
        # 读取二进制掩码图片
        mask = cv2.imread(os.path.join(dir_path, filename), cv2.IMREAD_GRAYSCALE)

        # 获取滑坡体的边界框信息
        boxes = get_bounding_boxes(mask)

        # 创建XML文件并填充标签信息
        root = ET.Element('annotation')
        ET.SubElement(root, 'filename').text = filename
        size = ET.SubElement(root, 'size')
        ET.SubElement(size, 'width').text = str(mask.shape[1])
        ET.SubElement(size, 'height').text = str(mask.shape[0])
        for box in boxes:
            object = ET.SubElement(root, 'object')
            ET.SubElement(object, 'name').text = 'slide'
            bndbox = ET.SubElement(object, 'bndbox')
            ET.SubElement(bndbox, 'xmin').text = str(box[0])
            ET.SubElement(bndbox, 'ymin').text = str(box[1])
            ET.SubElement(bndbox, 'xmax').text = str(box[2])
            ET.SubElement(bndbox, 'ymax').text = str(box[3])

        # 保存XML文件
        xml_tree = ET.ElementTree(root)
        xml_tree.write(os.path.join('B', f'{os.path.splitext(filename)[0]}.xml'))

这样，就能够将文件夹A内的所有二进制掩码图片转换为XML格式的目标检测标签，并将标签文件放入文件夹B中。

2、滑坡图片拼接

可以使用Python中的OpenCV库来读取若干滑坡图片，并将其拼接为一张大图。具体步骤如下：

1）. 定义函数来读取若干滑坡图片

def read_images(image_paths):
    images = []
    for image_path in image_paths:
        image = cv2.imread(image_path)
        images.append(image)
    return images

2）. 定义函数来将若干滑坡图片拼接为一张大图

def concat_images(image_paths):
    # 读取所有滑坡图片
    images = read_images(image_paths)

    # 获取每张图片的大小
    heights, widths = zip(*[image.shape[:2] for image in images])

    # 计算拼接后的图片大小
    max_height = max(heights)
    total_width = sum(widths)

    # 创建空白的拼接结果
    concat_image = np.zeros((max_height, total_width, 3), dtype=np.uint8)

    # 将每张图片拼接到拼接结果中
    x = 0
    for image in images:
        h, w = image.shape[:2]
        concat_image[:, x:x+w] = image
        x += w

    return concat_image

3）. 遍历文件夹A下的所有滑坡图片，并将每四张图片拼接在一起

import os

# 文件夹A的路径
dir_path = 'A/'

# 遍历文件夹A下的所有滑坡图片
image_paths = []
for filename in os.listdir(dir_path):
    if filename.endswith('.jpg'):  # 假设所有滑坡图片的格式为jpg
        image_paths.append(os.path.join(dir_path, filename))

# 每四张图片为一组，进行拼接
for i in range(0, len(image_paths), 4):
    # 获取当前组的四张滑坡图片的路径
    current_paths = image_paths[i:i+4]

    # 读取四张滑坡图片并拼接
    concat_image = concat_images(current_paths)

    # 将拼接结果保存到文件夹B中
    cv2.imwrite(os.path.join('B', f'{i//4}.png'), concat_image)

这样，就能够将文件夹A内的若干滑坡图片每四张滑坡图片为一组拼接在一起，并确保最后的拼接结果为一矩形，并将拼接的图片放入文件夹B中。

如果以上回答对您有所帮助，点击一下采纳该答案～谢谢

编辑记录

报告相同问题？

关注问题

IP地址/子网掩码的golang CIDR前缀表示法（点十进制）
2017-09-05 20:55

回答 1 已采纳 The go standard library does not have a function to create that representation. That being said, i
在Go中将网络掩码转换为CIDR
2019-08-28 20:37

回答 2 已采纳 This isn't very obvious at first, but: addr := ip.To4() sz, _ := net.IPV4Mask(addr[0], addr[1], a
ip地址怎么利用子网掩码一拆为二 tcp/ip
2022-10-30 09:49

回答 1 已采纳举个例子，比如192.168.1.0/24的一个网段，要求拆分成4个子网2的二次方是4，所以需要向主机位借2，现在的网段掩码就是26位，此时的四个网段分别为，192.168.1.0/26（第四段为00
旋转目标检测：截止2024年最新研究方案对比解读
2024-07-18 10:12

沉浸式AI的博客对截止2024年以来有代表性“旋转目标检测”的方案对比分析
在Golang中将网络掩码号转换为32位
2016-01-08 08:42

回答 4 已采纳 Borrowed from some stackoverflow post itself, using logical operators. mask = (0xFFFFFFFF <&lt
计算机网络基础，关于IP地址和子网掩码网络
2022-03-01 20:14

回答 1 已采纳用块的概念来划分就OK了。100台，在块中，就是12830台，刚好剔除头尾，可用30，所以块就是32 所以，按需求的划分为：第一个子网有100台主机： 192.168.3.0/25 （128块，2
掩码31位，为什么能通信？ tcp/ip 网络网络协议
2023-03-25 02:36

回答 4 已采纳掩码31只能在点到点链接的情况（point-to-point link）,其目的是为了节省IP地址。而这两个点到点的主机可以直接通信，不需要网关的介入。在这种掩码情况下，没有广播地址。如果希望深入了解
2D目标检测综述之检测模型篇（二）
2022-07-17 16:05

视觉先锋的博客一、二阶段检测器 1.R－CNN R－CNN分为以下4个模块：区域提议生成：作者使用选择性搜索算法从每张图像上生成2000个类别独立的区域提议。区域特征提取：遵循AlexNet的架构，作者使用一个CNN，该CNN包含5个卷...
网络系统子网划分，子网掩码 tcp/ip 网络协议网络安全
2022-11-21 20:03

回答 4 已采纳这个最少也要用2个C类大小的网段：148台那个单占一个256个IP的段，掩码24，比如192.168.1.0/255.255.255.0；76台那个用128个IP的段，掩码25，比如192.168.2
已知IP地址求子网掩码 tcp/ip udp 网络协议
2021-05-20 14:18

回答 1 已采纳做题思路步骤如下：首先知道网络位号共23位，32-23=9；所以二进制表示：11111111 11111111 11111110 0000 0000 计算将该二进制码转换成十进制：255
为什么改了掩码后可以访问网络网络协议
2023-03-28 16:47

回答 3 已采纳因为17.15.0.3/16会生成17.15.0.0 255.255.0.0的直连路由，访问这些硬盘录像机，用目的ip和这条直连路由一比较，符合就用自身ip发出arp请求消息，但自身所处的广播域和这
目标检测从入门到精通——数据增强方法总结
2024-09-10 11:12

小陈phd的博客随机翻转对图像进行水平翻转，增强模型对目标方向变化的鲁棒性。颜色抖动随机调整图像的亮度、对比度、饱和度和色调，增加数据多样性。随机缩放在训练过程中随机缩放图像，以适应不同尺寸的目标。Mosaic将四张图像...
身份证信息提取和掩码输出(填空) python
2022-08-24 18:51

回答 1 已采纳 icard = input() birthday = icard[6:10] + '-' + icard[10:12] + '-' + icard[12:14] mask = icard[:6]
目标检测进阶：1.COCO数据集与VOC数据集
2024-07-24 17:50

梦逐鹏影的博客主要介绍COCO数据集和VOC数据集相关信息，对每个文件都进行介绍，最后是提取COCO和VOC数据集边界框的代码，方便在目标检测任务中使用
用于多目标检测的自监督学习（SELF-SUPER VISED LEARNING FOR MULTIPLE OBJECTDETECTION）
2023-10-14 19:19

V建模忠哥V的博客自动视频监控需要检测、跟踪和识别场景中感兴趣的对象。在拥挤的场景中进行精确的监控是最具挑战性的计算机视觉应用之一。为了解决机场检查站安全领域的视觉监控问题，东北大学国土安全部ALERT（爆炸相关威胁的意识...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月9日

悬赏问题

¥15 io.jsonwebtoken.security.Keys
¥15 急，ubuntu安装后no caching mode page found等
¥15 联想交换机NE2580O/NE1064TO安装SONIC
¥15 防火墙的混合模式配置
¥15 Ubuntu不小心注销了要怎么恢复啊
¥15 win10电脑安装完plcsim advanced4.0运行时为什么会提示找不到虚拟网卡
¥15 安装powerbuilder10卡在安装程序正在运行这个页面没有下一步任何指令
¥15 关于mpi的问题：请问遇到这种情况需要怎么解决，出现这个问题后电脑不能进行mpi多核运行只能进行单核运行
¥50 微信聊天记录备份到电脑提示成功了，但还是没同步到电脑微信
¥15 python怎么在已有视频文件后添加新帧

二进制掩码转目标检测标签

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新