胸部CT及掩码数据集

求胸部CT原始图像及对应的病灶掩码的数据集，最好能包括胸部CT所能体现的各个病灶。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-08-17 09:05
关注
上午好☀️☀️☀️️
本答案参考通义千问

您提到的“胸部CT及掩码数据集”是医学影像领域中一个非常重要的研究方向，尤其是在肺部病灶检测、分割和分类任务中。以下是一些公开可用的胸部CT图像及其对应病灶掩码的数据集，并附上详细说明与使用建议。

一、推荐的胸部CT及掩码数据集

1. LIDC-IDRI (Lung Image Database Consortium and Image Database Resource Initiative)

官网链接: https://wiki.cancerimagingarchive.net/
描述:
包含约1,000例胸部CT扫描图像。
每个病例有多个放射科医生标注的肺结节位置和性质（良性或恶性）。
提供原始CT图像和对应的肺结节掩码。

特点:
数据质量高，适合用于肺结节检测与分割。
可以用于训练深度学习模型进行病灶定位和分类。

适用任务:
肺结节检测
病灶分割
肿瘤分类

2. NIH ChestX-ray14 Dataset

官网链接: https://www.nih.gov/news-events/news-releases/nih-releases-chest-x-ray-dataset
描述:
包含超过10万张胸部X光图像。
每张图像都带有14种疾病标签（如肺炎、气胸等）。
不提供掩码，但可用于多标签分类任务。

特点:
数据量大，适合做大规模分类任务。
适用于肺部疾病的初步筛查。

适用任务:
疾病分类
多标签分类
图像检索

3. VinDr-CXR Dataset

官网链接: https://vinbigdata.com/
描述:
包含约6,000张胸部X光图像。
每张图像都有标注的病灶位置（如肺部阴影、气胸等）。
提供掩码图像（mask）。

特点:
数据来源为越南医院，覆盖多种常见胸部疾病。
适合用于肺部病灶分割任务。

适用任务:
病灶分割
图像标注
深度学习模型训练

4. BraTS (Brain Tumor Segmentation) Dataset

官网链接: https://www.nitrc.org/projects/brats/
注意:
不是胸部CT数据集，而是脑部MRI数据集。
但其结构和掩码格式可以作为参考。

适用任务:
图像分割
多模态医学图像处理

5. CheXpert Dataset

官网链接: https://stanfordmlgroup.github.io/cheXpert/
描述:
包含约10万张胸部X光图像。
每张图像有10种可能的异常标签（如肺炎、心力衰竭等）。
没有掩码，但适合做多标签分类任务。

适用任务:
疾病分类
异常检测
自动诊断辅助系统

二、如何获取这些数据集？

1. 通过官方网站下载

访问上述每个数据集的官方网站，注册后下载数据。
有些数据集需要申请权限，例如 LIDC-IDRI 和 NIH ChestX-ray14。

2. 通过Kaggle平台

一些数据集也上传到了Kaggle，例如：
https://www.kaggle.com/datasets
搜索关键词："chest xray", "lung CT", "medical image segmentation"

3. 通过PyTorch或TensorFlow的库加载

使用 torchvision 或 tf.data 加载图像和掩码数据。
示例代码如下：

import torch from torchvision import transforms from torch.utils.data import Dataset, DataLoader class ChestCTDataset(Dataset): def __init__(self, image_paths, mask_paths, transform=None): self.image_paths = image_paths self.mask_paths = mask_paths self.transform = transform def __len__(self): return len(self.image_paths) def __getitem__(self, idx): image_path = self.image_paths[idx] mask_path = self.mask_paths[idx] # Load image and mask (you need to implement this part) image = load_image(image_path) mask = load_mask(mask_path) if self.transform: image = self.transform(image) mask = self.transform(mask) return image, mask # Example usage transform = transforms.ToTensor() dataset = ChestCTDataset(image_paths, mask_paths, transform=transform) dataloader = DataLoader(dataset, batch_size=4, shuffle=True)

三、注意事项

数据隐私与伦理问题：医学影像数据涉及患者隐私，使用前需确保已获得合法授权。
数据预处理：不同数据集的图像格式、分辨率、标注方式可能不同，需统一处理。
标注一致性：不同医生对同一图像的标注可能存在差异，可考虑使用集成学习或加权平均来提高准确性。

四、总结

| 数据集名称 | 类型 | 是否含掩码 | 适用任务 | |------------|------|-------------|-----------| | LIDC-IDRI | CT | ✅ | 肺结节检测、分割 | | NIH ChestX-ray14 | X-ray | ❌ | 分类、多标签识别 | | VinDr-CXR | X-ray | ✅ | 病灶分割 | | BraTS | MRI | ✅ | 脑部肿瘤分割 | | CheXpert | X-ray | ❌ | 疾病分类 |

如果您需要特定病种的掩码数据集（如肺癌、肺炎、气胸等），可以进一步指定需求，我可以为您提供更具体的资源推荐。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

医疗大模型训练必备数据集 | 上海交通大学提出多模态视觉-语言胸部CT分析数据集
2024-11-12 20:38

小马不会过河的博客上海交通大学在预印本平台Arxiv上发表的文章“”研究了一个数据集叫做RadGenome-Chest CT，它是为3D胸部CT解释而设计的全面、大规模且具有细粒度注释的数据集，建立在公开可用的CT-RATE基础之上。大型基础模型的发展...
AI开发教程(三十一):常用数据集推荐之图像数据集
2025-08-11 14:19

小李也疯狂的博客本教程系统梳理了计算机视觉领域的常用图像数据集，涵盖通用基础数据集（如ImageNet、COCO、CIFAR）、专业领域数据集（医学影像、遥感图像、工业质检）以及新兴任务数据集（生成式AI、自动驾驶等）。针对每个数据集...
【完整源码+数据集+部署教程】胸部CT图像分割系统： yolov8-seg-vanillanet
2025-09-30 10:59

飞翔的佩奇的博客【完整源码+数据集+部署教程】胸部CT图像分割系统： yolov8-seg-vanillanet
人工智能数据集（资源篇）（更新于2020.11.27）
2019-01-07 15:24

守望者白狼的博客记录机器学习、计算机视觉、自然语言处理、无人驾驶、医疗、金融、政府领域开源的数据集
图像处理及深度学习开源数据集大全（四万字呕心沥血整理）
2022-11-24 11:20

HIT_Vanni的博客本文整理了150 余个深度学习和图像处理领域的开源数据集，包括：目标检测、人脸识别、文本识别、图像分类、缺陷检测、医学影像、图像分割、图像去雾、关键点检测、动作识别、姿态估计、自动驾驶、RGBT共13个方向。
2024 最新高质量 - 医学影像数据集
2024-09-25 15:40

数据猎手小k的博客医学影像数据集对于推动医学影像分析技术的发展、提高医疗服务质量、加速疾病诊断和治疗研究具有重要作用。
开源数据集分类汇总（医学，卫星，分割，分类，人脸，农业，姿势等）
2023-08-08 14:50

MrRoose的博客本文汇总了医学图像、卫星图像、语义分割、自动驾驶、图像分类、人脸、农业、打架识别等多个方向的数据集资源，均附有下载链接。
86、利用注意力机制增强 EfficientNet 实现精准胸部 CT 图像分析及空气质量问题研究
2025-08-30 11:20

秃然暴富的博客本博文介绍了一种结合通道注意力和软注意力机制的EfficientNetB0 V2模型，用于精准的胸部CT图像分析。该方法通过迁移学习和特征增强技术，在非COVID、COVID和社区获得性肺炎（CAP）分类任务中实现了高达99.42%的总体...
使用MD.ai标注医学图像及covid-19数据集标注
2022-04-28 09:53

BBM的开源HUB的博客本文档涵盖注册、推荐的浏览器设置、打开分配的案例和故障排除。了解使用 MD.ai 启动和运行所有深度学习项目的基础知识。
基于图像分割的LIDC-IDRI 数据集预处理之实战预处理篇
2024-07-18 14:42

折柳_的博客上一篇《基于图像分割的LIDC-IDRI 数据集预处理之数据下载篇》介绍了关于lidc的数据下载，本篇将针对数据集进行具体的处理，包括肺实质分割，结节标注，数据集划分等，针对数据集预处理所用到的有关技术参考了博主...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月17日

码龄粉丝数原力等级 --

胸部CT及掩码数据集

5条回答默认最新

码龄粉丝数原力等级 --

一、推荐的胸部CT及掩码数据集

1. LIDC-IDRI (Lung Image Database Consortium and Image Database Resource Initiative)

2. NIH ChestX-ray14 Dataset

3. VinDr-CXR Dataset

4. BraTS (Brain Tumor Segmentation) Dataset

5. CheXpert Dataset

二、如何获取这些数据集？

1. 通过官方网站下载

2. 通过Kaggle平台

3. 通过PyTorch或TensorFlow的库加载

三、注意事项

四、总结

问题事件

码龄粉丝数原力等级 --

胸部CT及掩码数据集

5条回答 默认 最新

一、推荐的胸部CT及掩码数据集

1. LIDC-IDRI (Lung Image Database Consortium and Image Database Resource Initiative)

2. NIH ChestX-ray14 Dataset

3. VinDr-CXR Dataset

4. BraTS (Brain Tumor Segmentation) Dataset

5. CheXpert Dataset

二、如何获取这些数据集？

1. 通过官方网站下载

2. 通过Kaggle平台

3. 通过PyTorch或TensorFlow的库加载

三、注意事项

四、总结

问题事件

5条回答默认最新