刘虾 2025-09-18 23:31 采纳率: 49.4%

已结题

python将目标识别多个框汇总一个大框

python目标识别有多个框，有40个框，其中有30个框的位置在一排(y方向坐标几乎相同），通过交并比判断大于0.1的，将这30个框汇总一个大框，最终是有11个框，画框在原图上

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

檀越@新空间 2025-09-18 23:32

关注

晚上好🌙🌙🌙
本答案参考通义千问

在Python中，如果你有多个目标检测框（bounding boxes），并且希望将其中位置相近的框合并为一个大框，可以通过以下步骤实现：

1. 问题分析

你有40个目标检测框。
其中有30个框位于同一行（y方向坐标几乎相同）。
需要通过**交并比（IoU）**来判断这些框是否可以合并。
IoU大于0.1的框将被合并成一个大的框。
最终结果是11个框。

2. 解决方案

步骤一：定义 bounding box 的结构

每个框由 [x1, y1, x2, y2] 表示，表示左上角和右下角坐标。

步骤二：计算两个框之间的 IoU

def compute_iou(box1, box2):
    # 计算两个框的交集区域
    x1 = max(box1[0], box2[0])
    y1 = max(box1[1], box2[1])
    x2 = min(box1[2], box2[2])
    y2 = min(box1[3], box2[3])

    # 计算交集面积
    intersection_area = max(0, x2 - x1) * max(0, y2 - y1)

    # 计算两个框的面积
    area1 = (box1[2] - box1[0]) * (box1[3] - box1[1])
    area2 = (box2[2] - box2[0]) * (box2[3] - box2[1])

    # 计算并集面积
    union_area = area1 + area2 - intersection_area

    # 计算 IoU
    iou = intersection_area / union_area if union_area > 0 else 0
    return iou

步骤三：合并相似框

def merge_boxes(boxes, iou_threshold=0.1):
    merged_boxes = []
    used = [False] * len(boxes)

    for i in range(len(boxes)):
        if not used[i]:
            current_box = boxes[i]
            # 合并所有与当前框 IoU 大于阈值的框
            for j in range(i + 1, len(boxes)):
                if not used[j] and compute_iou(current_box, boxes[j]) > iou_threshold:
                    # 合并框
                    new_x1 = min(current_box[0], boxes[j][0])
                    new_y1 = min(current_box[1], boxes[j][1])
                    new_x2 = max(current_box[2], boxes[j][2])
                    new_y2 = max(current_box[3], boxes[j][3])
                    current_box = [new_x1, new_y1, new_x2, new_y2]
                    used[j] = True
            merged_boxes.append(current_box)
            used[i] = True

    return merged_boxes

步骤四：画出合并后的框

使用 OpenCV 或 PIL 绘制框：

import cv2

# 假设原图是 image
image = cv2.imread("your_image.jpg")

# merged_boxes 是经过合并后的框列表
for box in merged_boxes:
    x1, y1, x2, y2 = box
    cv2.rectangle(image, (x1, y1), (x2, y2), (0, 255, 0), 2)

cv2.imshow("Merged Boxes", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

3. 完整流程总结

输入：原始目标检测框列表（如从模型输出获得）。
计算 IoU：遍历所有框，找出 IoU 大于 0.1 的框。
合并框：将相似的框合并为一个大的框。
输出：得到最终的 11 个框，并在图像上绘制。

4. 示例代码整合

import cv2

def compute_iou(box1, box2):
    x1 = max(box1[0], box2[0])
    y1 = max(box1[1], box2[1])
    x2 = min(box1[2], box2[2])
    y2 = min(box1[3], box2[3])
    intersection_area = max(0, x2 - x1) * max(0, y2 - y1)
    area1 = (box1[2] - box1[0]) * (box1[3] - box1[1])
    area2 = (box2[2] - box2[0]) * (box2[3] - box2[1])
    union_area = area1 + area2 - intersection_area
    iou = intersection_area / union_area if union_area > 0 else 0
    return iou

def merge_boxes(boxes, iou_threshold=0.1):
    merged_boxes = []
    used = [False] * len(boxes)

    for i in range(len(boxes)):
        if not used[i]:
            current_box = boxes[i]
            for j in range(i + 1, len(boxes)):
                if not used[j] and compute_iou(current_box, boxes[j]) > iou_threshold:
                    new_x1 = min(current_box[0], boxes[j][0])
                    new_y1 = min(current_box[1], boxes[j][1])
                    new_x2 = max(current_box[2], boxes[j][2])
                    new_y2 = max(current_box[3], boxes[j][3])
                    current_box = [new_x1, new_y1, new_x2, new_y2]
                    used[j] = True
            merged_boxes.append(current_box)
            used[i] = True

    return merged_boxes

# 示例输入
boxes = [[100, 200, 150, 250], [160, 200, 210, 250], [220, 200, 270, 250], ...]  # 40个框
merged_boxes = merge_boxes(boxes)

# 绘制
image = cv2.imread("your_image.jpg")
for box in merged_boxes:
    x1, y1, x2, y2 = box
    cv2.rectangle(image, (x1, y1), (x2, y2), (0, 255, 0), 2)

cv2.imshow("Merged Boxes", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

5. 注意事项

确保框的格式统一，如 [x1, y1, x2, y2]。
如果你的目标检测模型输出的是 [x_center, y_center, width, height]，需要先转换为 [x1, y1, x2, y2]。
可以调整 iou_threshold 来控制合并的严格程度。

6. 总结

重点步骤如下：

计算 IoU 来判断框之间是否重叠。
合并重叠框，生成新的大框。
绘制最终框 到原图上。

通过这种方式，你可以将原本 40 个框合并为 11 个更合理的框。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(6条)

报告相同问题？

关注问题

用Python实现AI人脸识别
2024-08-01 17:45

小尤笔记的博客实现AI人脸识别通常涉及到使用深度学习库，如TensorFlow或PyTorch，配合预训练的人脸识别模型。以下是一个使用Python和TensorFlow框架中的模块来加载和使用一个预训练的人脸识别模型的简单示例。
【Python学习教程】Python编程基础_python编程 csdn
2024-04-27 21:47

2401_84140023的博客类型原理优点缺点编译型语言通过专门的编译器，将所有源代码一次性转换成特定平台（Windows、Linux 等）执行的机器码（以可执行文件的形式存在）。编译一次后，脱离了编译器也可以运行，并且运行效率高。可移植性差...
python语音识别框架_横评：五款免费开源的语音识别工具
2020-12-19 11:59

weixin_39620943的博客本文原作者 Cindi Thompson，美国德克萨斯大学奥斯汀分校(University of Texas at Austin)计算机科学博士，数据科学咨询公司硅谷数据科学(Silicon Valley Data Science，SVDS)首席科学家，在机器学习、自然语言处理...
用python实现人脸识别，小白也能上手，你还不会？
2023-12-01 10:26

认真写程序的强哥的博客，我的第一映像就是手机上的人脸识别解锁，目前，在学校公寓里面也有人脸识别的机器，我记得首先是收集了我们学生们的照片，应该是存入数据库的，我们学生的信息，包括学号，以及所在系等等，学校都是存入数据库的。...
python笔记——【Python学习教程】Python编程基础_python编程
2024-11-30 18:15

小怡在干什么的博客我们可以使用汉语直接告诉计算机做什么，比如“Siri，打开酷狗音乐”，但使用过这些系统的读者都知道，它尚未完全成熟，再加上我们语言充满了模糊和不精确因素，使得设计一个完全理解人类语言的计算机程序，...
10 个“疯狂”的 Python 项目创意，值得一试！
2023-03-21 15:53

IT自学妹的博客这是一个非常基本的 Python 程序，始终监视某个文件夹，每当有文件添加到该文件夹中时，它都会检查其类型并相应地将其移动到特定的文件夹中。你可以添加更多的功能，如人脸检测和识别。Songkick 是一项非常受欢迎的...
Python 编程必备：常用 IDE 大汇总，优缺点全解析！
2024-12-03 16:18

爱吃香菜的博客本文将概述最受程序员欢迎的 Python IDE，以及其他值得考虑的选项。在此之前，我们先来看看 IDE 是什么。
基于 Python 与 TensorFlow 的动物识别卷积神经网络系统
2025-08-14 01:49

Python作为一种高级编程语言，因其简洁明了的语法和强大的科学计算库而备受开发者青睐，TensorFlow则是一个开源的机器学习库，用于设计、训练和部署各种深度学习模型。动物识别系统的核心是卷积神经网络算法模型。...
Yolo目标检测系统 Flask框架深度学习 目标识别 计算机视觉大数据毕业设计（建议收藏）✅
2025-09-19 19:22

源码之家的博客 Yolo目标检测系统 Flask框架深度学习 目标识别 计算机视觉大数据毕业设计（建议收藏）✅
Python生态GUI框架
2025-12-06 13:11

johnny233的博客 Tcl库有一个C接口，用于创建和管理一个或多个Tcl解释器实例，并在这些实例中运行Tcl命令和脚本，添加用Tcl或C实现的自定义命令。每个解释器都拥有一个事件队列，某些部件可向解释器发送事件交由其处理。与Python不同...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月18日