求MIMIC-CXR Dataset数据!
本人做实验的时候想要用一下这个数据,但是在给出的官网里发现并不是很好下载,有没有已经下载好的朋友能够共享一下?
这是官方给出的网址:https://physionet.org/content/mimic-cxr-jpg/2.0.0/
求MIMIC-CXR Dataset数据
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
4条回答 默认 最新
关注引自免费微信小程序:皆我百晓生
获取MIMIC-CXR Dataset数据可能需要一些额外步骤,因为官方网站上可能没有提供预下载的选项。不过,你可以在GitHub上找到一些社区贡献的资源,或者通过数据集管理工具来简化下载过程。以下是一个详细的步骤指南:
-
安装必要的库: 首先,确保你已经安装了
pip包管理器。如果没有,可以通过命令行运行python -m pip install --upgrade pip。 -
访问GitHub仓库: 有许多项目会提供预处理的MIMIC-CXR数据。一个常见的选择是浏览 MIMIC-CXR GitHub存储库。在搜索框中输入 "MIMIC-CXR dataset",你会找到相关的数据集下载和处理脚本。
-
找到合适的数据集: 在找到的项目中,比如
mimic-cxr-dataset或pytorch-mimic-cxr这样的项目,通常会有data或datasets文件夹,里面包含下载链接或预处理后的数据。查看README文件或文档,了解如何获取数据。 -
下载数据: 根据项目的指示,可能需要你下载原始图像数据(
.tar.gz或.zip文件)以及相应的标签文件。这些文件可能会很大,所以可能需要一些时间。 -
解压数据: 使用命令行工具(如
tar或unzip),根据文件扩展名解压下载的数据。例如,如果你下载的是.tar.gz文件,可以这样解压:tar -xvf mimic-cxr-jpg.tar.gz -
数据预处理: 如果数据还没有被预处理成适合实验的格式,可能需要运行项目提供的脚本来转换数据。这可能包括将图像转换为numpy数组、标签编码等操作。
-
存储数据: 将数据移动到你的工作目录,或者按照项目要求的路径结构进行组织,以便在Python代码中方便地引用。
-
加载数据: 在Python中,你可以使用像
pandas和numpy这样的库来读取数据。例如,如果你的标签文件是CSV格式,可以这样做:import pandas as pd labels_df = pd.read_csv('labels.csv') images = np.load('images.npy')
请确保在使用任何第三方数据集时检查版权和许可条款,以确保你的使用符合规定。如果你在下载或处理过程中遇到问题,记得查阅项目文档或寻求社区支持。
解决 无用评论 打赏 举报 编辑记录-