DL初学者 2023-03-10 00:59 采纳率: 60%
浏览 67
已结题

使用Sybil代码预测肺癌概率,无法进入训练

问题遇到的现象和发生背景

Sybil代码无法进入训练

遇到的现象和发生背景,请写出第一个错误信息

Sybil是一个使用患者胸腔CT图片,预测未来患肺癌概率的代码,当我按要求建立虚拟环境,并修改地址后,在Ubuntu终端输入训练参数时,不能进入训练

用代码块功能插入代码,请勿粘贴截图。 不用代码块回答率下降 50%
python train.py \
    --dataset nlst --batch_size 3  \
    --gpus 8 \
    --precision 16 \
    --max_followup 6 \
    --img_file_type png \
    --min_num_images 0 \
    --num_images 200 \
    --use_only_thin_cuts_for_ct \
    --slice_thickness_filter 2.5 \
    --resample_pixel_spacing_prob 0.5 \
    --use_annotations \
    --region_annotations_filepath /media/bsuo/Elements/code/Sybil/annot_dir/nlst_annotations.json \
    --img_mean 128.1722 \
    --img_std 87.1849 \
    --img_size 256 256 \
    --num_chan 3 \
    --limit_train_batches 0.5 \
    --limit_val_batches 1.0 \
    --max_epochs 10 \
    --init_lr 3e-5 \
    --lr_decay 0.1 \
    --weight_decay 1e-2 \
    --momentum 0.9 \
    --dropout 0.1 \
    --optimizer adam \
    --patience 5 \
    --tuning_metric c_index \
    --num_workers 3 \
    --profiler simple \
    --num_sanity_val_steps 0 \
    --save_dir /media/bsuo/Elements/code/Sybil/model_dir/sybil1 --img_dir /media/bsuo/Elements/CT_image/NLST-937/manifest-NLST_allCT/NLST/nlst-ct-png \
    --results_path /path/to/results_dir/sybil.results \
    --cache_path /media/bsuo/Elements/code/Sybil/cache_dir 
    > /media/bsuo/Elements/code/Sybil/log_dir/sybil.txt 2>&1
运行结果及详细报错内容

运行后,无法进入训练

我想要达到的结果,如果你需要快速回答,请尝试 “付费悬赏”

希望能进入训练过程

  • 写回答

5条回答 默认 最新

  • 「已注销」 2023-03-10 07:11
    关注

    参考GPT和自己的思路:首先,出现无法进入训练的错误信息时,需要查看终端上的错误提示信息,以确定具体的问题。可以尝试检查以下几个方面:

    1 检查训练所需的依赖是否已经正确安装在虚拟环境中,例如PyTorch、NumPy、pandas等。

    2 检查输入的数据路径是否正确,以及数据格式是否符合代码要求。

    3 检查训练参数是否正确设置,例如batch_size、max_epochs、learning_rate等。

    4 检查系统资源是否足够,例如GPU内存是否充足、是否有足够的CPU和内存等。

    针对上述代码,可以尝试修改以下几个方面:

    1 检查数据路径是否正确设置。需要确认图片文件的路径是否与代码中的img_dir参数一致。

    2 检查GPU资源是否充足。如果GPU内存不足,可以考虑减少batch_size或者使用更小的模型进行训练。

    3 检查输入数据是否满足要求。可以检查slice_thickness_filter参数是否正确设置,以及检查图片格式是否符合要求。

    4 尝试去掉管道符号">"和"2>&1",以便在终端上直接查看错误信息。

    修改后的代码示例:

    python train.py \
        --dataset nlst --batch_size 3  \
        --gpus 8 \
        --precision 16 \
        --max_followup 6 \
        --img_file_type png \
        --min_num_images 0 \
        --num_images 200 \
        --use_only_thin_cuts_for_ct \
        --slice_thickness_filter 2.5 \
        --resample_pixel_spacing_prob 0.5 \
        --use_annotations \
        --region_annotations_filepath /media/bsuo/Elements/code/Sybil/annot_dir/nlst_annotations.json \
        --img_mean 128.1722 \
        --img_std 87.1849 \
        --img_size 256 256 \
        --num_chan 3 \
        --limit_train_batches 0.5 \
        --limit_val_batches 1.0 \
        --max_epochs 10 \
        --init_lr 3e-5 \
        --lr_decay 0.1 \
        --weight_decay 1e-2 \
        --momentum 0.9 \
        --dropout 0.1 \
        --optimizer adam \
        --patience 5 \
        --tuning_metric c_index \
        --num_workers 3 \
        --profiler simple \
        --num_sanity_val_steps 0 \
        --save_dir /media/bsuo/Elements/code/Sybil/model_dir/sybil1 \
        --img_dir /media/bsuo/Elements/CT_image/NLST-937/manifest-NLST_allCT/NLST/nlst-ct-png \
        --results_path /path/to/results_dir/sybil.results \
        --cache_path /media/bsuo/Elements/code/Sybil/cache_dir 
    
    
    评论

报告相同问题?

问题事件

  • 系统已结题 3月18日
  • 创建了问题 3月10日