Harryzzzzzhang 2024-04-14 22:25 采纳率: 0%
浏览 378

求MIMIC-CXR Dataset数据

求MIMIC-CXR Dataset数据!
本人做实验的时候想要用一下这个数据,但是在给出的官网里发现并不是很好下载,有没有已经下载好的朋友能够共享一下?
这是官方给出的网址:https://physionet.org/content/mimic-cxr-jpg/2.0.0/

  • 写回答

4条回答 默认 最新

  • 专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-14 22:25
    关注

    引自免费微信小程序:皆我百晓生

    获取MIMIC-CXR Dataset数据可能需要一些额外步骤,因为官方网站上可能没有提供预下载的选项。不过,你可以在GitHub上找到一些社区贡献的资源,或者通过数据集管理工具来简化下载过程。以下是一个详细的步骤指南:

    1. 安装必要的库: 首先,确保你已经安装了pip包管理器。如果没有,可以通过命令行运行 python -m pip install --upgrade pip

    2. 访问GitHub仓库: 有许多项目会提供预处理的MIMIC-CXR数据。一个常见的选择是浏览 MIMIC-CXR GitHub存储库。在搜索框中输入 "MIMIC-CXR dataset",你会找到相关的数据集下载和处理脚本。

    3. 找到合适的数据集: 在找到的项目中,比如mimic-cxr-datasetpytorch-mimic-cxr 这样的项目,通常会有datadatasets 文件夹,里面包含下载链接或预处理后的数据。查看README文件或文档,了解如何获取数据。

    4. 下载数据: 根据项目的指示,可能需要你下载原始图像数据(.tar.gz.zip 文件)以及相应的标签文件。这些文件可能会很大,所以可能需要一些时间。

    5. 解压数据: 使用命令行工具(如tarunzip),根据文件扩展名解压下载的数据。例如,如果你下载的是.tar.gz文件,可以这样解压:

      tar -xvf mimic-cxr-jpg.tar.gz
      
    6. 数据预处理: 如果数据还没有被预处理成适合实验的格式,可能需要运行项目提供的脚本来转换数据。这可能包括将图像转换为numpy数组、标签编码等操作。

    7. 存储数据: 将数据移动到你的工作目录,或者按照项目要求的路径结构进行组织,以便在Python代码中方便地引用。

    8. 加载数据: 在Python中,你可以使用像pandasnumpy这样的库来读取数据。例如,如果你的标签文件是CSV格式,可以这样做:

      import pandas as pd
      labels_df = pd.read_csv('labels.csv')
      images = np.load('images.npy')
      

    请确保在使用任何第三方数据集时检查版权和许可条款,以确保你的使用符合规定。如果你在下载或处理过程中遇到问题,记得查阅项目文档或寻求社区支持。

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 4月14日