对于机器学习数据集的归一化问题

我是先将训练集进行归一化,再将训练集的归一化方法适用到测试集上,这样建立SVM模型效果很好。
但是,当我想用该模型进行预测的时候,发现对一个新的数据集进行归一化,出现了数值大于1的情况(原因是训练集中已经明确了在该维度上的最大值,比如2,但是新的数据集在该维度出现了大于2的情况)这样归一化结果很影响预测结果,想问问大家遇到这种问题应该如何解决

1个回答

训练集和测试集必须同时规一化
对于实际预测数据,经过相同比率缩放超过范围,要么视作无效数据,丢弃,要么视作饱和数据,也就是无论多大,都当作1处理。
具体用什么方法,要看你的实际的情况。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐