我现在有一些视频数据,主要是监控视角的一些正常及异常的片段。
准备实现的是通过姿态识别,识别出人体骨骼,根据一段时序的骨骼坐标数据判断动作。
这种情况下请问要如何去制作数据集和标注数据。之前用VoTT标注了一些,就是为视频一帧一帧标注人物动作(像下图这样),但是感觉这样标注和骨骼数据也没什么关系,是否可以这样去标注。现在有点乱,麻烦大佬们指点迷津。
我现在有一些视频数据,主要是监控视角的一些正常及异常的片段。
准备实现的是通过姿态识别,识别出人体骨骼,根据一段时序的骨骼坐标数据判断动作。
这种情况下请问要如何去制作数据集和标注数据。之前用VoTT标注了一些,就是为视频一帧一帧标注人物动作(像下图这样),但是感觉这样标注和骨骼数据也没什么关系,是否可以这样去标注。现在有点乱,麻烦大佬们指点迷津。