遥感图像数据集RSICD

下面这段代码来自：
https://github.com/isaaccorley/torchrs#remote-sensing-image-captioning-dataset-rsicd
整个功能是怎样的，最终能生成字幕嘛？

import torchvision.transforms as T
from torchrs.datasets import RSICD

transform = T.Compose([T.ToTensor()])

dataset = RSICD(
    root="path/to/dataset/",
    split="train",  # or 'val', 'test'
    transform=transform
)

x = dataset[0]
"""
x: dict(
    x:        (3, 224, 224)
    captions: List[str]
)
"""

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

在github上下载的RSICD数据集压缩包无法解压缩数据分析深度学习目标检测
2022-12-17 13:13

回答 1 已采纳你下那个如果是1KB的，就肯定不是，Readme中说到了，因为太大了，
【Image captioning】RSICD遥感图像字幕数据集生成Resnet特征
2024-05-10 23:07

CV视界的博客该数据集中的遥感图像的语言描述更相关，因为这些描述不包含预定义的观察方向和模糊的形容词，使用了3325个不同的单词。在此过程中，它将对图像的标注信息进行一些基本预处理（例如，转为小写、添加 UNK 标记等），...
探索遥感图像的智慧之眼：RSICD 数据集
2024-06-09 09:56

齐游菊Rosemary的博客探索遥感图像的智慧之眼：RSICD 数据集 项目地址:https://gitcode.com/201528014227051/RSICD_optimal 项目简介在智能时代，遥感图像理解成为了地球观测的关键技术之一。为了推动这一领域的发展，我们向您推荐 ...
深度学习中的遥感影像数据集~持续更新
2020-06-08 14:50

GISer_Lin的博客深度学习遥感影像数据集
转载 | 深度学习中的遥感影像数据集
2021-04-10 17:41

Geo地理数据研究所的博客本文转载自博主GISer_Lin原创文章《深度学习中的遥感影像数据集》点击此处转跳原文以下数据集均为网上开源数据集，若有遗误或不慎涉及侵权，烦请评论或留言联系目前本项目共整理场景分类数据集25个（整理完结...
面向遥图像数据的Image Caption研究附源码
2020-06-15 11:16

Jerry_liu20080504的博客面向遥感图像数据的Image Caption 相关理论知识请参见其他文章，这里只从工程角度进行描写，重点是源代码。参考网址： 1.面向遥感图像的Image caption 数据集：【干货】让遥感图像活起来：遥感图像描述生成的...
深度学习中的遥感影像数据集
2020-10-15 10:53

LIsaWinLee的博客深度学习中的遥感影像数据集 收集网络上公开的遥感数据集
（ISPRS，2023）深度语义-视觉对齐用于zero-shot遥感图像场景分类
2024-04-02 21:09

lalula1999的博客深度神经网络在遥感图像分类方面取得了令人期待的进展，其中训练过程需要大量的每个类别样本。然而，考虑到遥感目标数据库的动态增长，为每个遥感类别注释标签是耗时且不切实际的。零样本学习（ZSL）允许识别在训练...
遥感图像多模态检索AMFMN（支持关键词、句子对图像的检索）论文阅读、环境搭建、模型测试、模型训练
2023-12-11 17:29

qq_41627642的博客遥感跨模态文本图像检索以其灵活的输入和高效的查询等优点受到了广泛的关注。然而，传统的方法忽略了遥感图像多尺度和目标冗余的特点，导致检索精度下降。为了解决遥感多模态检索任务中的多尺度稀缺性和目标冗余问题...
一种具有细粒度和多尺度的多源跨模态遥感图像检索方法
2021-11-03 15:49

Governer的博客更加细粒度的多源遥感图文数据集(RSITMD)三、实验结果总结前言随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。本文介绍一种遥感领域非...
一种轻量化多尺度的遥感跨模态图文检索方法
2021-11-30 20:52

Governer的博客本文提出一种面向遥感数据的具有极小规模模型参数的跨模态检索方法，并基于知识蒸馏设计了一种多层级监督优化算法来提升小模型的检索精度。最后基于对比学习构建了一种半监督优化算法，通过使用无标签数据来进一步...
划分数据集常用代码
2021-12-01 19:11

Rashore的博客主要思路将一个数据集文件前80%用于训练，80%-90%用于测试，90%-100%用于验证。 #!/usr/bin/env python # -*- coding:utf-8 -*- # 将一个文件夹下图片按比例分在三个文件夹下 import os import random import ...
遥感影像资源推荐：解锁开源数据集与强大GPU算力的无限可能
2024-01-31 12:51

我爱计算机视觉的博客遥感影像处理识别是对利用遥感技术获取的图像数据进行识别和分析的过程。这种技术使用从航空器、卫星或其他遥感平台获取的图像数据，经过识别和分析后广泛应用在多种场景中，包括但不限于以下几个方面：在农业活动中...
【Image captioning】AI算法说——图像描述（Image captioning）
2023-06-11 14:45

CV视界的博客 COCO数据集是一个大规模常见物体检测、分割和图像描述的数据集。它包含超过330k张图像，其中包括2.5 million个目标实例，每张图像都有...COCO数据集已成为自然语言处理和计算机视觉领域中一个非常优秀的基准数据集。2、
【Image captioning-RS】论文阅读十—Self-Learning for Few-Shot Remote Sensing Image Captioning_2022
2024-04-18 10:17

CV视界的博客深度神经网络因其出色性能而被广泛应用于遥感图像的分析和解释。典型的应用场景包括场景分类[1,2]、目标检测[3,4]和实例分割[5,6]。遥感图像字幕生成作为一个需要同时建模遥感图像中的视觉特征和语义信息的多模态...
探索遥感新纪元：RemoteCLIP - 遥感领域的视觉语言基础模型
2024-06-04 09:34

尚舰舸Elsie的博客探索遥感新纪元：RemoteCLIP - 遥感领域的视觉语言基础模型???? 项目地址:https://gitcode.com/ChenDelong1999/RemoteCLIP 项目简介 RemoteCLIP 是一项创新性的研究成果，它标志着遥感领域迎来首个融合了强大语义...
《RemoteCLIP: A Vision Language Foundation Model for Remote Sensing》2024遥感顶刊TGRS论文
2024-07-23 19:28

夏日的盒盒的博客 RemoteCLIP是首个针对遥感领域的视觉-语言基础模型，旨在学习具有丰富语义的视觉特征和与文本嵌入对齐的鲁棒特征，以实现无缝的下游应用。该模型通过数据扩展解决了预训练数据稀缺的问题，将异构注释转换为统一的...
遥感影像~
2024-01-31 13:35

whaosoft143的博客该数据集包含了 288 个视频片段，共计 261908帧和 10209 张静态图像，覆盖范围广泛，包括位置（来自中国 14 个不同城市，相距数千公里）、环境（城市和乡村）、物体（行人、车辆、自行车等）以及密度（稀疏和拥挤...
文章解读：Attribute-Cooperated Convolutional Neural Network for Remote Sensing Image Classification
2021-01-11 14:22

angry_snail_flying的博客目录摘要方法实验数据集实验结果Bibtex 摘要遥感影像中，往往包含大量复杂内容，非常不利于图像内容的识别。例如沙漠、荒地，在视觉上非常相似。因此，文章提出了一个属性合作卷积神经网络（Attribute-cooperated ...
（ICLR，2024）HarMA：高效的协同迁移学习与模态对齐遥感技术
2024-06-03 21:24

lalula1999的博客随着视觉和语言预训练（VLP）的兴起，越来越多的下游任务采用了先预训练后微调的范式。尽管这一范式在各种多模态下游任务中展示了潜力，但在遥感领域的实施遇到了一些障碍。具体来说，同模态嵌入倾向于聚集在一起，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月24日

悬赏问题

¥20 求文心中文心理分析系统（TextMind)
¥15 chipyard环境搭建问题
¥15 python，pyopenGL的OBV渲染无法设置透明
¥20 matlab可以把多个二维图合成为三维瀑布图吗
¥15 EEPROM,软件i2c
¥500 求解读该段JS代码，需要知道是用干什么的
¥20 qt4代码实现二进制文件读取显示，以及显示的内容进行搜索
¥15 Labview获取LK-G3001数据
¥15 我知道什么是混合树，但是怎么写代码啊
¥50 开发板linux系统安装dpkg,apt函数库有偿

遥感图像数据集RSICD

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新