llg2ting 2020-06-19 23:08 采纳率: 0%
浏览 417

对于机器学习数据集的归一化问题

我是先将训练集进行归一化,再将训练集的归一化方法适用到测试集上,这样建立SVM模型效果很好。
但是,当我想用该模型进行预测的时候,发现对一个新的数据集进行归一化,出现了数值大于1的情况(原因是训练集中已经明确了在该维度上的最大值,比如2,但是新的数据集在该维度出现了大于2的情况)这样归一化结果很影响预测结果,想问问大家遇到这种问题应该如何解决

  • 写回答

1条回答 默认 最新

  • threenewbee 2020-06-20 10:57
    关注

    训练集和测试集必须同时规一化
    对于实际预测数据,经过相同比率缩放超过范围,要么视作无效数据,丢弃,要么视作饱和数据,也就是无论多大,都当作1处理。
    具体用什么方法,要看你的实际的情况。

    评论

报告相同问题?

悬赏问题

  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记