Oracle_kyn 2021-06-03 19:18 采纳率: 0%
浏览 30

Image captioning (看图说话)与图文检索有什么区别?

文字搜索图片与看图说话原理相同吗,图文检索的原理是什么,如何实现文字搜图片

  • 写回答

1条回答 默认 最新

  • Alexxinlu 2021-06-12 10:09
    关注

    图片结构化:

    对图片进行信息抽取,进一步得到图片的结构化信息描述,例如:识别图片中的文本信息(例如:广告、路牌、字幕、落款等),目标检测(例如:人、动物、植物、车、建筑等),图片的风格(例如:自然、城市、道路、农村等)……

    文字检索图片:

    基于图片的结构化信息,使用相似度或度量算法,将用户输入的检索文本,与所有图片的结构化信息计算相似度,并按相似度大小返回答案,实现检索功能。

    看图说话:

    也是基于图片的结构化信息,使用模版或者生成模型,将结构化信息转换成正常的语言描述,实现看图说话的功能。

     

    评论

报告相同问题?

悬赏问题

  • ¥50 怎么判断同步时序逻辑电路和异步时序逻辑电路
  • ¥15 差动电流二次谐波的含量Matlab计算
  • ¥15 Can/caned 总线错误问题,错误显示控制器要发1,结果总线检测到0
  • ¥15 C#如何调用串口数据
  • ¥15 MATLAB与单片机串口通信
  • ¥15 L76k模块的GPS的使用
  • ¥15 请帮我看一看数电项目如何设计
  • ¥23 (标签-bug|关键词-密码错误加密)
  • ¥66 比特币地址如何生成taproot地址
  • ¥20 数学建模数学建模需要