关于目标跟踪的ID分配问题

先生们，我写了一个目标跟踪的算法，基于hsv颜色空间的，在进行多目标跟踪时，我给物体分配了ID，但总是出现ID错乱的情况，ID不能保证固定跟踪原有的物体，会跑到另外的被跟踪物体上，先生们能帮忙解决一下吗?下面是我的跟踪和分配id的代码：

class VideoThread(threading.Thread):
    def __init__(self, video, fps, red_speeds, time_stamps):
        super().__init__()
        self.video = video
        self.fps = fps
        self.red_speeds = red_speeds
        self.time_stamps = time_stamps
        self.is_running = True
        self.start_time = time.time()
        self.object_tracks = {}
        self.object_id_map = {}
        self.kalman_filters = {}  # 存储卡尔曼滤波器

    def track_object(self, rect, frame):
        x, y, w, h = rect
        center = np.array([[x + w // 2], [y + h // 2]], dtype=np.float32)
        object_position = str(center)

        if object_position not in self.object_id_map:
            object_id = len(self.object_id_map) + 1
            self.object_id_map[object_position] = object_id
            self.object_tracks[object_id] = {'speeds': [], 'time_stamps': []}
            self.kalman_filters[object_id] = KalmanFilter(state_dim=4, measurement_dim=2)  # 创建卡尔曼滤波器

        else:
            object_id = self.object_id_map[object_position]

        kalman_filter = self.kalman_filters[object_id]
        estimated_state = kalman_filter.update(center)

        speed = estimated_state[2, 0] / self.fps  # 速度为状态向量的第3个元素
        self.object_tracks[object_id]['speeds'].append(speed)
        current_time = time.time() - self.start_time
        self.object_tracks[object_id]['time_stamps'].append(current_time)

        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 255), 2)
        cv2.putText(frame, f"ID: {object_id}", (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 0, 255), 2)

这里是完整代码：

import tkinter as tk
from tkinter import messagebox
import numpy as np
import cv2
import matplotlib.pyplot as plt
import pandas as pd
from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg
import time
import threading
import os
# 初始化视频捕获
video = cv2.VideoCapture(0)

# 定义红色范围（HSV颜色空间）
lower_red = np.array([0, 127, 130], dtype=np.uint8)
upper_red = np.array([5, 255, 255], dtype=np.uint8)

# 获取视频的帧率
fps = video.get(cv2.CAP_PROP_FPS) if video.isOpened() else 0

# 初始化速度列表和时间戳列表
red_speeds = []
time_stamps = []

# 全局变量，用于控制视频循环
is_running = False

def on_closing():
    global is_running
    if messagebox.askokcancel("Quit", "Do you want to quit?"):
        is_running = False
        if video.isOpened():
            video.release()
        cv2.destroyAllWindows()
        root.destroy()


class KalmanFilter:
    def __init__(self, state_dim, measurement_dim):
        self.kalman = cv2.KalmanFilter(state_dim, measurement_dim)
        self.kalman.transitionMatrix = np.eye(state_dim)
        self.kalman.processNoiseCov = 0.01 * np.eye(state_dim)
        self.kalman.measurementNoiseCov = 0.1 * np.eye(measurement_dim)
        self.kalman.statePost = np.zeros((state_dim, 1), dtype=np.float32)
        self.kalman.errorCovPost = np.eye(state_dim, dtype=np.float32)

    def update(self, measurement):
        prediction = self.kalman.predict()
        estimated = self.kalman.correct(measurement)
        return estimated

class VideoThread(threading.Thread):
    def __init__(self, video, fps, red_speeds, time_stamps):
        super().__init__()
        self.video = video
        self.fps = fps
        self.red_speeds = red_speeds
        self.time_stamps = time_stamps
        self.is_running = True
        self.start_time = time.time()
        self.object_tracks = {}
        self.object_id_map = {}
        self.kalman_filters = {}  # 存储卡尔曼滤波器

    def track_object(self, rect, frame):
        x, y, w, h = rect
        center = np.array([[x + w // 2], [y + h // 2]], dtype=np.float32)
        object_position = str(center)

        if object_position not in self.object_id_map:
            object_id = len(self.object_id_map) + 1
            self.object_id_map[object_position] = object_id
            self.object_tracks[object_id] = {'speeds': [], 'time_stamps': []}
            self.kalman_filters[object_id] = KalmanFilter(state_dim=4, measurement_dim=2)  # 创建卡尔曼滤波器

        else:
            object_id = self.object_id_map[object_position]

        kalman_filter = self.kalman_filters[object_id]
        estimated_state = kalman_filter.update(center)

        speed = estimated_state[2, 0] / self.fps  # 速度为状态向量的第3个元素
        self.object_tracks[object_id]['speeds'].append(speed)
        current_time = time.time() - self.start_time
        self.object_tracks[object_id]['time_stamps'].append(current_time)

        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 255), 2)
        cv2.putText(frame, f"ID: {object_id}", (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 0, 255), 2)

    def stop_video(self):
        self.is_running = False
    def run(self):
        global is_running
        next_object_id = 1  # 将 next_object_id 移到这里来初始化
        try:
            while self.is_running:
                ret, frame = self.video.read()
                if not ret:
                    self.stop_video_with_error("Failed to grab frame")
                    break

                hsv_img = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
                mask = cv2.inRange(hsv_img, lower_red, upper_red)
                mask = cv2.GaussianBlur(mask, (5, 5), 0)
                contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

                self.process_contours(contours, frame, next_object_id)

                cv2.imshow("Tracking", frame)
                if cv2.waitKey(int(1000 / self.fps)) & 0xFF == ord('q'):
                    break
        except Exception as e:
            self.stop_video_with_error(f"An error occurred: {e}")
        finally:
            self.cleanup_video()

    def process_contours(self, contours, frame, next_object_id):
        for cnt in contours:
            rect = cv2.boundingRect(cnt)
            if rect[2] * rect[3] > 100:
                self.track_object(rect, frame, next_object_id)
                next_object_id += 1

    def track_object(self, rect, frame, object_id):
        x, y, w, h = rect
        center = (x + w // 2, y + h // 2)
        if object_id not in self.object_tracks:
            self.object_tracks[object_id] = {'speeds': [], 'time_stamps': []}
        speed = center[0] / self.fps
        self.object_tracks[object_id]['speeds'].append(speed)
        current_time = time.time() - self.start_time
        self.object_tracks[object_id]['time_stamps'].append(current_time)
        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 255), 2)
        cv2.putText(frame, f"ID: {object_id}", (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 0, 255), 2)

    def stop_video_with_error(self, error_message):
        messagebox.showerror("Error", error_message)
        self.is_running = False
    def cleanup_video(self):
        self.is_running = False
        if self.video.isOpened():
            self.video.release()
        cv2.destroyAllWindows()
        is_running = False

# 创建主窗口
root = tk.Tk()
root.title("Red Object Tracker")
root.protocol("WM_DELETE_WINDOW", on_closing)

# 创建开始按钮，并定义开始视频捕捉的函数
def start_video():
    global video_thread, is_running
    if not is_running:
        is_running = True
        video_thread = VideoThread(video, fps, red_speeds, time_stamps)
        video_thread.start()
    else:
        messagebox.showinfo("Info", "Video is already running.")

start_button = tk.Button(root, text="Start Video", command=start_video)
start_button.pack()

# 创建停止按钮，并定义停止视频捕捉的函数
def stop_video():
    global video_thread, is_running
    if is_running:
        video_thread.stop_video()
        video_thread.join()
        is_running = False
    else:
        messagebox.showinfo("Info", "Video is not running.")

stop_button = tk.Button(root, text="Stop Video", command=stop_video)
stop_button.pack()


# 创建更新图表按钮
def update_chart():
    plt.close('all')  # 关闭所有之前的图表窗口
    for object_id, track in video_thread.object_tracks.items():
        if not track['speeds'] or not track['time_stamps']:
            continue

        # 创建速度图
        fig_speed = plt.figure(figsize=(5, 5))
        plt.plot(track['time_stamps'], track['speeds'], label=f'Red Object {object_id} Speed')
        plt.xlabel('Time (seconds)')
        plt.ylabel('Speed (pixels per second)')
        plt.title(f'Speed of Red Object {object_id} Over Time')
        plt.legend()
        plt.grid(True)

        # 进行傅里叶变换
        fft_speed = np.fft.fft(track['speeds'])
        freq = np.fft.fftfreq(len(track['speeds']))

        # 创建频域图
        fig_fft = plt.figure(figsize=(5, 5))
        plt.plot(freq, np.abs(fft_speed))
        plt.xlabel('Frequency (Hz)')
        plt.ylabel('Amplitude')
        plt.title(f'Frequency Domain of {object_id}')
        plt.grid(True)

        # 在界面左右两侧显示速度图和频域图
        speed_frame = tk.Frame(root)
        speed_frame.pack(side=tk.LEFT, fill=tk.BOTH, expand=1)

        fft_frame = tk.Frame(root)
        fft_frame.pack(side=tk.RIGHT, fill=tk.BOTH, expand=1)

        speed_canvas = FigureCanvasTkAgg(fig_speed, master=speed_frame)
        speed_canvas.draw()
        speed_canvas.get_tk_widget().pack(side=tk.TOP, fill=tk.BOTH, expand=1)

        fft_canvas = FigureCanvasTkAgg(fig_fft, master=fft_frame)
        fft_canvas.draw()
        fft_canvas.get_tk_widget().pack(side=tk.TOP, fill=tk.BOTH, expand=1)

update_chart_button = tk.Button(root, text="Update Chart", command=update_chart)
update_chart_button.pack()

# 创建导出数据按钮
def export_data():
    if not video_thread.object_tracks:  # 检查是否有跟踪对象数据
        messagebox.showerror("Error", "No tracking data available.")
        return

    try:
        all_data = pd.DataFrame()  # 创建一个空的 DataFrame 用于存储所有速度数据
        for object_id, track in video_thread.object_tracks.items():
            df = pd.DataFrame({'Time (s)': track['time_stamps'], f'Speed_Object_{object_id} (px/s)': track['speeds']})
            all_data = pd.concat([all_data, df], axis=1)  # 将每个物体的速度数据合并到一个 DataFrame 中

        with pd.ExcelWriter('tracking_data.xlsx') as writer:
            all_data.to_excel(writer, sheet_name='All_Speed_Data', index=False)  # 将所有速度数据导出到一个工作表中

        messagebox.showinfo("Success", "Tracking data exported to tracking_data.xlsx.")

        # 唤醒 Excel 并打开导出的 Excel 文件
        os.startfile('tracking_data.xlsx')
    except Exception as e:
        messagebox.showerror("Error", f"Failed to export tracking data: {e}")

export_button = tk.Button(root, text="Export Data to Excel", command=export_data)
export_button.pack()

# 创建显示统计信息的按钮
# 创建显示统计信息的按钮
def show_stats():
    if not video_thread.object_tracks:  # 检查是否有跟踪对象数据
        messagebox.showerror("Error", "No tracking data available.")
        return

    stats_message = ""
    for object_id, track in video_thread.object_tracks.items():
        if not track['speeds'] or not track['time_stamps']:
            continue

        avg_speed = np.mean(track['speeds'])
        speed_variance = np.var(track['speeds'])
        correlation = np.corrcoef(track['time_stamps'], track['speeds'])[0, 1]
        stats_message += f"鸡冠 {object_id} - 平均速度: {avg_speed:.2f} px/s, 速度方差: {speed_variance:.2f}, 相关性: {correlation:.2f}\n"

    if stats_message:
        messagebox.showinfo("Statistics", stats_message)
    else:
        messagebox.showerror("Error", "No valid tracking data for statistics.")
    print("统计信息：")
    print(stats_message)
stats_button = tk.Button(root, text="Show Statistics", command=show_stats)
stats_button.pack()

# 主循环
root.mainloop()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

专家-赤兔[在线] 全栈领域优质创作者 2024-04-18 12:46

关注

引自免费微信小程序：皆我百晓生

在你的代码中，ID 错乱的问题可能源于当目标重叠或者消失又重新出现时，没有正确地管理ID映射。为了解决这个问题，我们可以采取以下步骤：

使用更稳定的特征来识别目标，例如使用轮廓特征或者目标检测方法得到的边界框。
当目标消失时，暂时保留其ID，等待它再次出现。
当多个目标重叠时，根据它们的颜色、形状或者其他特征进行区分。

这里提供一种改进方案，我们将使用边界框的中心点和宽度与高度的比值作为唯一标识符。这样可以更好地处理目标重叠的情况。此外，我们添加一个last_seen字典来记录每个ID最后一次出现的位置和时间，以便在目标短暂消失后恢复其ID。

首先，修改track_object函数，增加对边界框宽度与高度比值的处理，同时更新last_seen字典：

def track_object(self, rect, frame):
    x, y, w, h = rect
    center = np.array([[x + w // 2], [y + h // 2]], dtype=np.float32)
    aspect_ratio = w / h
    object_key = f"{center[0]}, {center[1]}, {aspect_ratio}"

    if object_key not in self.object_id_map:
        object_id = len(self.object_id_map) + 1
        self.object_id_map[object_key] = object_id
        self.object_tracks[object_id] = {'speeds': [], 'time_stamps': []}
        self.kalman_filters[object_id] = KalmanFilter(state_dim=4, measurement_dim=2)  # 创建卡尔曼滤波器
        self.last_seen[object_id] = (center, time.time())

    else:
        object_id = self.object_id_map[object_key]
        last_center, last_time = self.last_seen[object_id]
        distance = np.linalg.norm(np.array(last_center) - center)
        elapsed_time = time.time() - last_time
        if distance < 5 and elapsed_time < 1:  # 可调整距离和时间阈值
            # 如果目标距离上次位置很近且时间间隔短，则认为是同一目标
            pass
        else:
            # 否则，创建新的ID并更新last_seen
            del self.object_id_map[object_key]
            del self.object_tracks[object_id]
            del self.kalman_filters[object_id]
            object_id = len(self.object_id_map) + 1
            self.object_id_map[object_key] = object_id
            self.object_tracks[object_id] = {'speeds': [], 'time_stamps': []}
            self.kalman_filters[object_id] = KalmanFilter(state_dim=4, measurement_dim=2)
            self.last_seen[object_id] = (center, time.time())

    kalman_filter = self.kalman_filters[object_id]
    estimated_state = kalman_filter.update(center)

    speed = estimated_state[2, 0] / self.fps  # 速度为状态向量的第3个元素
    self.object_tracks[object_id]['speeds'].append(speed)
    current_time = time.time() - self.start_time
    self.object_tracks[object_id]['time_stamps'].append(current_time)

    cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 255), 2)
    cv2.putText(frame, f"ID: {object_id}", (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 0, 255), 2)

然后，在process_contours函数中，我们需要处理目标消失的情况，即当目标不在当前帧中出现时，将ID标记为已消失：

def process_contours(self, contours, frame, next_object_id):
    for cnt in contours:
        rect = cv2.boundingRect(cnt)
        if rect[2] * rect[3] > 100:
            self.track_object(rect, frame, next_object_id)
            next_object_id += 1
        else:
            # 处理未检测到的目标
            for object_id, (_, last_time) in self.last_seen.items():
                if time.time() - last_time > 5:  # 可调整这个时间阈值
                    del self.object_id_map[str(last_time)]
                    del self.object_tracks[object_id]
                    del self.kalman_filters[object_id]
                    del self.last_seen[object_id]

这样，你应该能解决ID错乱的问题。不过请注意，这只是一个基本的解决方案，实际应用中可能还需要考虑更多的因素，比如目标的运动模型、遮挡情况等。对于复杂的场景，可能需要使用更复杂的目标跟踪算法，如DeepSORT、SORT等。

编辑记录

报告相同问题？

关注问题

关于线程的ID新手问题
2015-05-10 11:51

回答 1 已采纳每次线程创建都会分配新的线程ID
如何在Go Micro Service中为每个日志添加跟踪ID
2019-05-28 13:42

回答 1 已采纳 It might be worth reading up on context.Context particularly this article which has a section that
mysql数据表主键id自增导出导入问题 mysql 数据库
2018-11-27 02:53

回答 2 已采纳导出的时候就把id当做一个普通字段导出来，导出来的id肯定也是断裂的，和数据库一样的，导进去的时候也把id导入，值固定，应该就是和你导出来的一样了
作为ID预测的多目标跟踪
2024-05-22 15:43

在地球迷路的怪兽的博客在多目标跟踪( Multiple Object Tracking，MOT )中，基于检测的跟踪方法经受了长时间的考验，该方法根据定义将跟踪过程分为两个部分：目标检测和目标关联。他们利用鲁棒的单帧检测器，通过手工设计的启发式算法和...
一个新生报道宿舍分配的问题 mysql php
2018-07-09 01:30

回答 4 已采纳这是多线程问题把表锁死了、
mongodb的ID为String类型查询时的问题 mongodb
2018-04-20 12:17

回答 5 已采纳你可以试试我这样的方法查询 ``` public static void main(String[] args) { //1. 连接到mongodb服务
查看tomcat进程id的问题请教指点 tomcat
2018-09-05 09:33

回答 3 已采纳您根据ps -ef|grep tomcat 命令找到tomcat的进程号，如您上传的图中进程id是190，然后您根据命令：lsof -i | grep 进程id 即可查到当前tomcat进程启动了哪些
多目标跟踪评价指标学习
2024-07-09 15:54

Anlina Li的博客多目标跟踪评价指标详解：个人学习笔记分享。探讨IDF1、MOTA等关键指标，理解它们如何衡量跟踪系统性能。技术探索，力求简明易懂，希望对你有所启发。
（新手）关于HTML简单登录的问题代码的问题 html5
2015-10-30 11:04

回答 1 已采纳像这种应该用ajax来做，然后对返回来做处理，同时控制重复提交
通过ajax传入id查询数据问题 ajax javascript
2017-10-24 13:41

回答 6 已采纳 ajax里的cache,true的话会读缓存，可能真的到服务器上。假如上次访问了a.html，第二次的时候得到的是上次访问的a.html的结果，而不是重新到服务器获取。 false的话会在url
关于Apache频繁停止工作问题 apache
2019-01-24 16:33

回答 1 已采纳 php5ts.dll模块问题、重装一下PHP环境、记得勾选dll模块
DeepSORT：深度学习与目标跟踪的完美结合.pdf
2024-07-25 09:20

DeepSORT（Deep Simple Online and Realtime Tracking）是一种先进的多目标跟踪算法，在计算机视觉和人工智能领域中展现出巨大的潜力。该算法结合了传统的SORT算法的高效性与深度学习的强大表征能力，实现了在复杂...
c# 关于一个任务分配多个线程(挺着急的) c#
2017-02-07 14:42

回答 2 已采纳 class Program { static void Main(string[] args) { Task thread1
YOLOv8 多目标跟踪与常见问题汇总
2023-03-19 22:43

shiter的博客为什么要用yolo v8 做目标跟踪，因为目标检测的下一个应用任务本来就是目标跟踪，两者可以天然的结合起来。
【目标跟踪】匈牙利算法
2023-09-06 16:47

读书猿的博客匈牙利算法是一种在多项式时间内求解任务...在多目标跟踪 Multiple Object Tracking 中，其目的主要是为了进行帧与帧之间的多个目标的匹配，其中包括新目标的出现，旧目标的消失，以及前一帧与当前帧的目标 id 匹配。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月18日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

关于目标跟踪的ID分配问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新