aaazbai 2022-12-08 15:46 采纳率: 78.6%

浏览 26

已结题

三维重建中，transformer是怎么学习2D图像的深度值的？

是用双目立体视觉？对训练集有特殊要求？比如怎么分辨一张2D图像中的棒子，是竖直摆放，还是斜着摆放但处于特定位置导致拍出来看像竖直的摆放。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ShowMeAI 2022-12-08 16:15
关注
望采纳

transformer在三维重建中学习2D图像的深度值通常是通过单目视觉来实现的。它会计算图像中物体之间的几何关系，并利用这些信息来估计深度值。对于训练集，Transformer并不对图像有特殊要求，只需要提供大量带有深度信息的2D图像即可。在训练过程中，Transformer会根据图像中物体的几何关系来判断它们的深度值。

比如cvpr2022的GuideFormer: Transformers for Image Guided Depth Completion

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月8日