qq_41169717 2021-10-07 00:04 采纳率: 75%
浏览 13
已结题

Shell、Unix 数据处理和分割

Shell 数据预处理 并分割为训练集,测试集,交叉验证集 (共两问)

原变量名称及属性:


@attribute 'age' real
@attribute 'sex' { female, male}
@attribute 'cipli' { typ_angina, asympt, non_anginal, atyp_angina}
@attribute 'trest' real
@attribute 'chololocate' real
@attribute 'fbshu' { t, f}
@attribute 'rest' { left_vent_hyper, normal, st_t_wave_abnormality}
@attribute 'thach' real
@attribute 'xang' { no, yes}
@attribute 'oldpipeak' real
@attribute 'slpe' { up, flat, down}
@attribute 'cait' real
@attribute 'that' { fixed_defect, normal, reversable_defect}
@attribute 'num' { '<50_1', '>50_4', '>50_5', '>51_8', '>59_9'}

问题一:将名词变量改为二进制
我使用的方法 如下:(存在BUG)其中所有带下划线变量无法被更改为二进制,并且所有带有t/f的词都被改变。该如何修改呢?

tail -n +315 data.arff|sed -e"s/female/0/g" |
   sed -e"s/male/1/g" |
   sed -e"s/typ_angina/0 0 0 1/g" |
   sed -e"s/asympt/0 0 1 0/g" |
   sed -e"s/non_anginal/0 1 0 0/g" |
   sed -e"s/atyp_angina/1 0 0 0/g" |
   sed -e"s/t/0/g" |
   sed -e"s/f/1/g" |
   sed -e"s/left_vent_hyper/0 0 1/g" |
   sed -e"s/normal/0 1 0/g" |
   sed -e"s/st_t_wave_abnormality/1 0 0/g" |
   sed -e"s/no/0/g" |
   sed -e"s/yes/1/g" |
   sed -e"s/up/0 0 1/g" |
   sed -e"s/flat/0 1 0/g" |
   sed -e"s/down/1 0 0/g" |
   sed -e"s/fixed_defect/0 0 1/g" |
   sed -e"s/normal/0 0 1/g" |
   sed -e"s/reversable_defect/1 0 0/g" |
   sed -e"s/left_vent_hyper/0 0 1/g" |
   sed -e"s/<50/0 0 0 0 1/g" |
   sed -e"s/>50_1/0 0 0 1 0/g" |
   sed -e"s/>50_2/0 0 1 0 0/g" |
   sed -e"s/>50_3/0 1 0 0 0/g" |
   sed -e"s/>50_4/1 0 0 0 0/g" >>train.pat

问题二:如何分割测试集和交叉验证

谢谢

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-10-08 14:38
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,已经为您补发到账户,我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。

    评论

报告相同问题?

问题事件

  • 系统已结题 10月15日
  • 创建了问题 10月7日

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器