Eric12219180 2023-02-06 16:18 采纳率: 62.2%
浏览 104
已结题

CBIS-DDSM kaggle 资料处理

以下是資料下載處:
https://www.kaggle.com/datasets/awsaf49/cbis-ddsm-breast-cancer-image-dataset

img

下載後打開會有兩個子文件夾 csv和jpeg如下:

img

jpeg裡面又有好幾個文件夾:

img

"隨機"裝著mamogramm的 full mamogramm, cropped images 和 ROI images,
看似只能够过csv档之间的交叉比对才能够找出真正相对应的 full mamogramm, cropped images, 和ROI images.

img


我想要把真正对应的 full mamogramm, cropped images, 和ROI images.分别装在同样的文件夹里面。
感觉很复杂, 有人做过或是会做的吗?

  • 写回答

3条回答 默认 最新

  • cjh4312 2023-02-06 21:47
    关注
    #复制文件函数
    def copy_files(l,dd):
        for n in range(len(dd)):
            d=re.findall(r'/(.*)/', dd.loc[n,'image file path'])[0]
            a=re.findall(r'/(.*)', d)[0]
            old_path=f"D:/archive/jpeg/{a}"
            full_filenames=os.listdir(old_path)
            
            os.makedirs(f"d:/images/{n+l}")
            for i in full_filenames:
                shutil.copy(f"{old_path}/{i}", f'd:/images/{n+l}/full_{n+l}.jpg')
                
            d=re.findall(r'/(.*)/', dd.loc[n,'cropped image file path'])[0]
            a=re.findall(r'/(.*)', d)[0]
            old_path=f"D:/archive/jpeg/{a}"
            if os.path.exists(old_path):
                cropped_filenames=os.listdir(old_path)
                for i in cropped_filenames:
                    if i[0]=='1':
                        shutil.copy(f"{old_path}/{i}", f'd:/images/{n+l}/cropped_{n+l}.jpg')
                    else:
                        shutil.copy(f"{old_path}/{i}", f'd:/images/{n+l}/roi_{n+l}.jpg')
                    
    # dd=pd.read_csv('D:/archive/csv/dicom_info.csv')
    # info=dd[['image_path','PatientName']]
    
    dd=pd.read_csv('D:/archive/csv/calc_case_description_test_set.csv')
    copy_files(0,dd)
    l=len(dd)
    
    dd=pd.read_csv('D:/archive/csv/calc_case_description_train_set.csv')
    copy_files(l,dd)
    l=l+len(dd)
    
    dd=pd.read_csv('D:/archive/csv/mass_case_description_test_set.csv')
    copy_files(l,dd)
    l=l+len(dd)
    
    dd=pd.read_csv('D:/archive/csv/mass_case_description_train_set.csv')
    copy_files(l,dd)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 2月15日
  • 已采纳回答 2月7日
  • 创建了问题 2月6日

悬赏问题

  • ¥20 西南科技大学数字信号处理
  • ¥15 有两个非常“自以为是”烦人的问题急期待大家解决!
  • ¥30 STM32 INMP441无法读取数据
  • ¥15 R语言绘制密度图,一个密度曲线内fill不同颜色如何实现
  • ¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
  • ¥15 用visualstudio2022创建vue项目后无法启动
  • ¥15 x趋于0时tanx-sinx极限可以拆开算吗
  • ¥15 pyqt信号槽连接写法
  • ¥500 把面具戴到人脸上,请大家贡献智慧,别用大模型回答,大模型的答案没啥用
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。