番茄公主_ 2025-08-17 02:19 采纳率: 0%
浏览 23

胸部CT及掩码数据集

求胸部CT原始图像及对应的病灶掩码的数据集,最好能包括胸部CT所能体现的各个病灶。

  • 写回答

5条回答 默认 最新

  • 檀越@新空间 2025-08-17 09:05
    关注

    上午好☀️☀️☀️️
    本答案参考通义千问

    您提到的“胸部CT及掩码数据集”是医学影像领域中一个非常重要的研究方向,尤其是在肺部病灶检测、分割和分类任务中。以下是一些公开可用的胸部CT图像及其对应病灶掩码的数据集,并附上详细说明与使用建议。


    一、推荐的胸部CT及掩码数据集

    1. LIDC-IDRI (Lung Image Database Consortium and Image Database Resource Initiative)

    • 官网链接: https://wiki.cancerimagingarchive.net/
    • 描述:
      • 包含约1,000例胸部CT扫描图像。
      • 每个病例有多个放射科医生标注的肺结节位置和性质(良性或恶性)。
      • 提供原始CT图像和对应的肺结节掩码
    • 特点:
      • 数据质量高,适合用于肺结节检测与分割。
      • 可以用于训练深度学习模型进行病灶定位和分类
    • 适用任务:
      • 肺结节检测
      • 病灶分割
      • 肿瘤分类

    2. NIH ChestX-ray14 Dataset

    • 官网链接: https://www.nih.gov/news-events/news-releases/nih-releases-chest-x-ray-dataset
    • 描述:
      • 包含超过10万张胸部X光图像。
      • 每张图像都带有14种疾病标签(如肺炎、气胸等)。
      • 不提供掩码,但可用于多标签分类任务
    • 特点:
      • 数据量大,适合做大规模分类任务。
      • 适用于肺部疾病的初步筛查
    • 适用任务:
      • 疾病分类
      • 多标签分类
      • 图像检索

    3. VinDr-CXR Dataset

    • 官网链接: https://vinbigdata.com/
    • 描述:
      • 包含约6,000张胸部X光图像。
      • 每张图像都有标注的病灶位置(如肺部阴影、气胸等)。
      • 提供掩码图像(mask)。
    • 特点:
      • 数据来源为越南医院,覆盖多种常见胸部疾病。
      • 适合用于肺部病灶分割任务。
    • 适用任务:
      • 病灶分割
      • 图像标注
      • 深度学习模型训练

    4. BraTS (Brain Tumor Segmentation) Dataset

    • 官网链接: https://www.nitrc.org/projects/brats/
    • 注意:
      • 不是胸部CT数据集,而是脑部MRI数据集
      • 但其结构和掩码格式可以作为参考。
    • 适用任务:
      • 图像分割
      • 多模态医学图像处理

    5. CheXpert Dataset

    • 官网链接: https://stanfordmlgroup.github.io/cheXpert/
    • 描述:
      • 包含约10万张胸部X光图像。
      • 每张图像有10种可能的异常标签(如肺炎、心力衰竭等)。
      • 没有掩码,但适合做多标签分类任务
    • 适用任务:
      • 疾病分类
      • 异常检测
      • 自动诊断辅助系统

    二、如何获取这些数据集?

    1. 通过官方网站下载

    • 访问上述每个数据集的官方网站,注册后下载数据。
    • 有些数据集需要申请权限,例如 LIDC-IDRINIH ChestX-ray14

    2. 通过Kaggle平台

    3. 通过PyTorch或TensorFlow的库加载

    • 使用 torchvisiontf.data 加载图像和掩码数据。
    • 示例代码如下:
    import torch
    from torchvision import transforms
    from torch.utils.data import Dataset, DataLoader
    
    class ChestCTDataset(Dataset):
        def __init__(self, image_paths, mask_paths, transform=None):
            self.image_paths = image_paths
            self.mask_paths = mask_paths
            self.transform = transform
    
        def __len__(self):
            return len(self.image_paths)
    
        def __getitem__(self, idx):
            image_path = self.image_paths[idx]
            mask_path = self.mask_paths[idx]
    
            # Load image and mask (you need to implement this part)
            image = load_image(image_path)
            mask = load_mask(mask_path)
    
            if self.transform:
                image = self.transform(image)
                mask = self.transform(mask)
    
            return image, mask
    
    # Example usage
    transform = transforms.ToTensor()
    dataset = ChestCTDataset(image_paths, mask_paths, transform=transform)
    dataloader = DataLoader(dataset, batch_size=4, shuffle=True)
    

    三、注意事项

    • 数据隐私与伦理问题:医学影像数据涉及患者隐私,使用前需确保已获得合法授权。
    • 数据预处理:不同数据集的图像格式、分辨率、标注方式可能不同,需统一处理。
    • 标注一致性:不同医生对同一图像的标注可能存在差异,可考虑使用集成学习加权平均来提高准确性。

    四、总结

    | 数据集名称 | 类型 | 是否含掩码 | 适用任务 | |------------|------|-------------|-----------| | LIDC-IDRI | CT | ✅ | 肺结节检测、分割 | | NIH ChestX-ray14 | X-ray | ❌ | 分类、多标签识别 | | VinDr-CXR | X-ray | ✅ | 病灶分割 | | BraTS | MRI | ✅ | 脑部肿瘤分割 | | CheXpert | X-ray | ❌ | 疾病分类 |


    如果您需要特定病种的掩码数据集(如肺癌、肺炎、气胸等),可以进一步指定需求,我可以为您提供更具体的资源推荐。

    评论

报告相同问题?

问题事件

  • 创建了问题 8月17日