VDO-SLAM预处理过程中Mask-RCNN输出结果生成与格式问题

背景：尝试在其他KITTI数据集上运行VDO-SLAM

VDO-SLAM呈现了一种鲁棒的动态目标感知SLAM系统，该系统利用语义信息，可以在不具有目标形状或运动模型先验信息的条件下，对场景中的刚性物体进行运动估计。在数据预处理模块，需要对图像进行Mask-RCNN实例分割，作者的要求如下：

我是第一次使用Mask-RCNN，想问问熟手们，如何对demo.ipynb进行合适的修改，从而实现输出图片大小相同的，背景像素位标记为0，其他每一个实例像素位分别标记为1，2.....的.txt文件。我目前只能得出results列表中的masks，里面是false和true，而且不是二维的。请问针对这个问题该如何处理，就像是VDO-SLAM作者给出的demo-kitti文件夹处理的结果那样，满足数据组织形式

此外不知道有没有对VDO SLAM算法感兴趣的朋友，想问下实例分割txt文件里每个物体的标注是否需要全局统一。换句话说，我只能逐个处理序列的每一帧，这就可能导致第一帧的物体A和B分别标注为1，2，背景为0；下一帧A和B标注为2，1，背景仍为0。这是系统允许的吗？如何解决这个问题？能否将您复现成功时使用的mask-rcnn和pwc-net预处理模块的代码提供参考。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
heart_6662 2023-01-11 12:53
关注
望采纳！！！点击回答右侧采纳即可！！

对于你想实现的需求，我可以提供一些思路，帮助你完成对demo.ipynb的修改。

首先，在运行Mask R-CNN模型之后，你可以使用检测到的类别和掩模（masks）来处理图像。

具体来说，在检测到每一个实例后，你可以循环该实例的掩码，将每一个像素的值标记为相应的实例类别值(1, 2, 3...)。并且在掩码中找不到相应的类别时将该像素标记为0（背景像素）

然后，你可以使用处理好的图像，将其转换成文本文件。

可以考虑使用numpy.savetxt来存储文本文件。

为了使图片大小相同，你可以在读取图片之前使用某种图像处理技术(如OpenCV)来对图片进行resize。

总之，这个任务虽然不是非常困难，但需要对模型的输出结果进行适当的处理。希望我的回答能帮助你完成这个任务。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Linux中的vdo的作用和参数 linux 运维
2023-04-22 13:07

回答 2 已采纳 vdo(Virtual Data Optimize)：虚拟数据优化器作用：kvdo ##压缩数据（对于vdo设备当中的文件进行压缩，更加节省磁盘的空间）uds ##优化重复数据（对于
过滤Word中的Wordpress数据 php
2017-03-14 11:09

回答 2 已采纳 You can do it on the query level: $args = array( 'posts_per_page' => 5, 'post_type'=> '
如何从HTML5中的数据库一个接一个地显示视频 html5 php
2014-09-09 20:43

回答 1 已采纳 You can recursively call a play function which checks if the current video has ended, if it has it
VDO-SLAM预处理过程中Mask-RCNN输出结果生成与格式问题
2023-01-13 16:17

李多田的博客 VDO-SLAM 是一种基于视觉的三维重建技术，在预处理过程中可能会使用 Mask-RCNN 来提取图像中的物体轮廓。具体来说，Mask-RCNN 会输出每个检测到的物体的边界框和对应的分割掩码。这些输出结果可能会被保存为图像或者...
问一个关于grep的简单问题 linux
2010-10-26 11:46

回答 1 已采纳 egrep 'user:abc|name:nihao' catalina.out
什么是PHP处理ffmpeg和进度条的好函数[重复] php
2013-10-03 14:03

回答 1 已采纳 My approach was something like this $sCmd = "ffmpeg -i infile.mp4 ... -report outfile.mp4 > /v
VDO-SLAM 项目使用教程
2024-10-10 07:36

张亭齐Crown的博客 VDO-SLAM 项目使用教程 VDO_SLAM VDO-SLAM: A Visual Dynamic Object-aware SLAM System 项目地址: https://gitcode.com/gh_mirrors/v...
VDO-SLAM
2020-09-03 12:40

鹿米lincent的博客 VDO-SLAM（ A Visual Dynamic Object-aware SLAM System ） install ubuntu16，gcc >=9.2.1, opencv>= 3.0, eigen>= 3.1.0, g2o（in folder）更新gcc sudo add-apt-repository ppa:ubuntu-toolchain-...
[论文阅读]VDO-SLAM: A Visual Dynamic Object-aware SLAM System
2022-05-24 22:42

感天动地大白狗的博客一个动态SLAM框架VDO-LAM； ①利用光流法检测动态； ②构建因子图优化将动态点加入后端优化； ③可以解决遮挡的object创建方法
VDO-SLAM论文阅读
2022-04-14 22:40

陈同学_alex的博客 VDO-SLAM: A Visual Dynamic Object-aware SLAM System Jun Zhang[co]1, Mina Henein[co]1, Robert Mahony1 and Viorela Ila2 1Australian National University, Canberra 2University of Sydney, Sydney 2020年 ...
VDO-SLAM 基于视觉的动态感知SLAM系统
2021-04-21 12:14

初中就开始混世的大魔王的博客标题：VDO-SLAM: A Visual Dynamic Object-aware SLAM System 作者：Jun Zhang , Mina Henein , Robert Mahony and Viorela Ila 来源：https://arxiv.org/pdf/2005.11052.pdf 1.摘要（1）一个具有鲁棒性的动态...
两口气梳理完VDO-SLAM源码（一）
2022-01-14 06:50

wrotcat的博客从源码可以看到一些ORBSLAM的痕迹，主函数中，最关键的的地方就是SLAM.TrackRGBD(imRGB,imD_f,imFlow,imSem,mTcw_gt,vObjPose_gt,tframe,imTraj,nImages);，从这里就可以进入整个系统内部。这里要理解两件事： 1. ...
VDO-SLAM ：一种动态目标感知的视觉SLAM系统
2020-09-10 09:36

计算机视觉life的博客 VDO-SLAM ：一种动态目标感知的视觉SLAM系统（VDO-SLAM ：A Visual Dynamic Object-aware SLAM System）论文地址：https://arxiv.org/pdf/2005.11052v2.pdf 代码： https://github.com/halajun/vdo_slam 摘要： ...
VDO-SLAM: A Visual Dynamic Object-aware SLAM System
2021-10-09 12:58

我想静静，的博客 SLAM中处理动态物体的传统方法: 将任何与移动物体相关的传感器数据作为异常值处理，并将其从估计过程中去除(Hahnel et al. (2002, 2003);Wolf and Sukhatme (2005); Zhao et al. (2008); Bescoset al. (2018))， ...
论文于祥读及复现——《VDO-SLAM: A Visual Dynamic Object-aware SLAM System》
2023-09-11 16:16

琉璃轻纱的博客将实时定位和建图(SLAM)估计与动态场景建模相结合，可以极大地促进机器人在动态环境中的自主性。机器人的路径规划和避障任务依赖于对场景中动态物体运动的准确估计。本文介绍了VDO-SLAM，这是一个健壮的视觉动态对象...
论文阅读 2020 —— VDO-SLAM: A Visual Dynamic Object-aware SLAM System
2021-08-25 16:47

小玺玺的博客所以场景中如果存在大量运动的话就会有问题。所以现在动态SLAM越来越热门。所以作者提出了个动态SLAM算法，包含计算相机pose，运动目标轨迹和静态结构建图。作者计算这些参数用的是传统方法，识别运动目标和计算...
暑期研习系列：动态室外场景SLAM研究后续
2020-07-26 17:18

逆水独流的博客 VDO-SLAM：论文、安装与代码阅读一、VDO-SLAM论文阅读 OK，我们来看下VDO-SLAM（ A Visual Dynamic Object-aware SLAM System ）是什么？其实从名字上就能很清晰的看出，该SLAM系统主要用于解决动态场景的问题。...
据我所知，这是第一个完整实现运动分割、动态目标追踪等的「开源」动态SLAM系统！...
2020-08-10 07:00

3Ｄ视觉工坊的博客点击上方“3D视觉工坊”，选择“星标”干货第一时间送达今天给大家分享一篇最新文章，VDO-SLAM ：一种动态目标感知的视觉SLAM系统，原文名称 VDO-SLAM ：A Visual ...
第一阶段文献总结
2021-11-03 11:54

牛犇犇子木的博客 RCNN compared to GT segmentation appear to be minimal.)，depth的精度对运动估计精度影响较小，optical flow精度对运动估计结果影响最大（尤其在画面中有很远的物体时）（3）KITTI dataset：与 SLAM (where ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月11日

悬赏问题

¥20 关于游戏c++语言代码问题
¥15 如何制作永久二维码，最好是微信也可以扫开的。（相关搜索：管理系统）
¥15 delphi indy cookie 有效期
¥15 labelme打不开怎么办
¥35 按照图片上的两个任务要求，用keil5写出运行代码，并在proteus上仿真成功，🙏
¥15 免费的电脑视频剪辑类软件如何盈利
¥30 MPI读入tif文件并将文件路径分配给各进程时遇到问题
¥15 pycharm中导入模块出错
¥20 Ros2 moveit2 Windows环境配置，有偿，价格可商议。
¥15 有关“完美的代价”问题的代码漏洞

VDO-SLAM预处理过程中Mask-RCNN输出结果生成与格式问题

背景：尝试在其他KITTI数据集上运行VDO-SLAM

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新