是用双目立体视觉?对训练集有特殊要求?比如怎么分辨一张2D图像中的棒子,是竖直摆放,还是斜着摆放但处于特定位置导致拍出来看像竖直的摆放。
1条回答 默认 最新
- ShowMeAI 2022-12-08 16:15关注
望采纳
transformer在三维重建中学习2D图像的深度值通常是通过单目视觉来实现的。它会计算图像中物体之间的几何关系,并利用这些信息来估计深度值。对于训练集,Transformer并不对图像有特殊要求,只需要提供大量带有深度信息的2D图像即可。在训练过程中,Transformer会根据图像中物体的几何关系来判断它们的深度值。
比如cvpr2022的GuideFormer: Transformers for Image Guided Depth Completion本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 树莓派5怎么用camera module 3啊
- ¥20 java在应用程序里获取不到扬声器设备
- ¥15 echarts动画效果的问题,请帮我添加一个动画。不要机器人回答。
- ¥15 Attention is all you need 的代码运行
- ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
- ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
- ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
- ¥80 部署运行web自动化项目
- ¥15 腾讯云如何建立同一个项目中物模型之间的联系
- ¥30 VMware 云桌面水印如何添加