是用双目立体视觉?对训练集有特殊要求?比如怎么分辨一张2D图像中的棒子,是竖直摆放,还是斜着摆放但处于特定位置导致拍出来看像竖直的摆放。
1条回答 默认 最新
- ShowMeAI 2022-12-08 16:15关注
望采纳
transformer在三维重建中学习2D图像的深度值通常是通过单目视觉来实现的。它会计算图像中物体之间的几何关系,并利用这些信息来估计深度值。对于训练集,Transformer并不对图像有特殊要求,只需要提供大量带有深度信息的2D图像即可。在训练过程中,Transformer会根据图像中物体的几何关系来判断它们的深度值。
比如cvpr2022的GuideFormer: Transformers for Image Guided Depth Completion本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 es 7.17.20版本生成时间戳
- ¥15 wpf dategrid表头排序图标自定义
- ¥15 xshell无法连接提示ssh服务器拒绝密码
- ¥15 AT89C52单片机C语言关于串口通信的位操作
- ¥20 需要步骤截图(标签-服务器|关键词-map)
- ¥50 gki vendor hook
- ¥15 灰狼算法和蚁群算法如何结合
- ¥15 写一个利用ESP32自带按键和LED控制的录像代码
- ¥20 stm32f103,hal库 hal_usart_receive函数接收不到数据。
- ¥20 求结果和代码,sas利用OPTEX程序和D-efficiency生成正交集