万物皆bit 2022-12-24 11:58 采纳率: 69.2%
浏览 32
已结题

遥感图像数据集RSICD

下面这段代码来自:
https://github.com/isaaccorley/torchrs#remote-sensing-image-captioning-dataset-rsicd
整个功能是怎样的,最终能生成字幕嘛?

import torchvision.transforms as T
from torchrs.datasets import RSICD

transform = T.Compose([T.ToTensor()])

dataset = RSICD(
    root="path/to/dataset/",
    split="train",  # or 'val', 'test'
    transform=transform
)

x = dataset[0]
"""
x: dict(
    x:        (3, 224, 224)
    captions: List[str]
)
"""

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 1月1日
    • 修改了问题 12月24日
    • 创建了问题 12月24日

    悬赏问题

    • ¥20 求文心中文心理分析系统(TextMind)
    • ¥15 chipyard环境搭建问题
    • ¥15 python,pyopenGL的OBV渲染无法设置透明
    • ¥20 matlab可以把多个二维图合成为三维瀑布图吗
    • ¥15 EEPROM,软件i2c
    • ¥500 求解读该段JS代码,需要知道是用干什么的
    • ¥20 qt4代码实现二进制文件读取显示,以及显示的内容进行搜索
    • ¥15 Labview获取LK-G3001数据
    • ¥15 我知道什么是混合树,但是怎么写代码啊
    • ¥50 开发板linux系统安装dpkg,apt函数库 有偿