qq_46028445 2021-06-08 18:27 采纳率: 0%
浏览 25

处理字符串时常用整型数值代替字符串 或者 进行独热编码,请问两种方法分别在什么情况下适用?

就比如说这样的数据集做预测,Category那一列怎么处理比较合适?还有Category和Genres两列比较相似,如何处理比较妥当?(整个数据集共一万多条)

还有Content Rating那一列,其中大部分都是everyone,但是也有一些别的像少数民族那样出现,那么对于这样特征的数据怎么处理比较合适呢?

  • 写回答

2条回答 默认 最新

  • CSDN专家-AlanMax 2021-06-08 21:28
    关注

    这种直接使用类别的index编码,在分类的时候直接转换成one hot后经过交叉熵计算loss反向传播就行了。如有帮助请采纳

    评论

报告相同问题?

悬赏问题

  • ¥17 pro*C预编译“闪回查询”报错SCN不能识别
  • ¥15 微信会员卡接入微信支付商户号收款
  • ¥15 如何获取烟草零售终端数据
  • ¥15 数学建模招标中位数问题
  • ¥15 phython路径名过长报错 不知道什么问题
  • ¥15 深度学习中模型转换该怎么实现
  • ¥15 HLs设计手写数字识别程序编译通不过
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 TYPCE母转母,插入认方向