背景:尝试在其他KITTI数据集上运行VDO-SLAM
VDO-SLAM呈现了一种鲁棒的动态目标感知SLAM系统,该系统利用语义信息,可以在不具有目标形状或运动模型先验信息的条件下,对场景中的刚性物体进行运动估计。在数据预处理模块,需要对图像进行Mask-RCNN实例分割,作者的要求如下:
我是第一次使用Mask-RCNN,想问问熟手们,如何对demo.ipynb进行合适的修改,从而实现输出图片大小相同的,背景像素位标记为0,其他每一个实例像素位分别标记为1,2.....的.txt文件。我目前只能得出results列表中的masks,里面是false和true,而且不是二维的。请问针对这个问题该如何处理,就像是VDO-SLAM作者给出的demo-kitti文件夹处理的结果那样,满足数据组织形式
此外不知道有没有对VDO SLAM算法感兴趣的朋友,想问下实例分割txt文件里每个物体的标注是否需要全局统一。换句话说,我只能逐个处理序列的每一帧,这就可能导致第一帧的物体A和B分别标注为1,2,背景为0;下一帧A和B标注为2,1,背景仍为0。这是系统允许的吗?如何解决这个问题?能否将您复现成功时使用的mask-rcnn和pwc-net预处理模块的代码提供参考。