我涉及的工作是一个物体的6D位姿检测网络,是基于CDPN网络的改进,效果是用RGB图像预测特征图(特征图上每个像素所对应的模型上的三维点坐标),有没有比较理论的文章描述这一编码解码器提取图像特征并进行特征图预测的机制。至于我为什么要这个,这就要问我那个只会传统视觉但非要指手画脚的导师了,让我在开头加一小段引用论证从RGB图像提取3D信息的可行性,明明相关工作都是一笔带过的。有懂的朋友来帮帮忙吧
我涉及的工作是一个物体的6D位姿检测网络,是基于CDPN网络的改进,效果是用RGB图像预测特征图(特征图上每个像素所对应的模型上的三维点坐标),有没有比较理论的文章描述这一编码解码器提取图像特征并进行特征图预测的机制。至于我为什么要这个,这就要问我那个只会传统视觉但非要指手画脚的导师了,让我在开头加一小段引用论证从RGB图像提取3D信息的可行性,明明相关工作都是一笔带过的。有懂的朋友来帮帮忙吧