aaazbai 2022-12-08 15:46 采纳率: 78.6%
浏览 23
已结题

三维重建中,transformer是怎么学习2D图像的深度值的?

是用双目立体视觉?对训练集有特殊要求?比如怎么分辨一张2D图像中的棒子,是竖直摆放,还是斜着摆放但处于特定位置导致拍出来看像竖直的摆放。

  • 写回答

1条回答 默认 最新

  • ShowMeAI 2022-12-08 16:15
    关注

    望采纳


    transformer在三维重建中学习2D图像的深度值通常是通过单目视觉来实现的。它会计算图像中物体之间的几何关系,并利用这些信息来估计深度值。对于训练集,Transformer并不对图像有特殊要求,只需要提供大量带有深度信息的2D图像即可。在训练过程中,Transformer会根据图像中物体的几何关系来判断它们的深度值。


    比如cvpr2022的GuideFormer: Transformers for Image Guided Depth Completion

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月16日
  • 已采纳回答 12月8日
  • 创建了问题 12月8日

悬赏问题

  • ¥15 有两个非常“自以为是”烦人的问题急期待大家解决!
  • ¥30 STM32 INMP441无法读取数据
  • ¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
  • ¥15 用visualstudio2022创建vue项目后无法启动
  • ¥15 x趋于0时tanx-sinx极限可以拆开算吗
  • ¥500 把面具戴到人脸上,请大家贡献智慧,别用大模型回答,大模型的答案没啥用
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error