##机器学习中数据标准差极小的预处理策略
现有数据大致上服从正态分布,但是标准差极小,如果简单地归一化到[-1,1]处理,得到的数据90%会集中在[-0.3,0.3]中间,数据变得没有什么区分度,请问这种类型的数据应该用什么预处理的策略比较好?
1条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
繁华三千东流水 2019-09-07 09:37最佳回答 专家已采纳在吴恩达的机器学习教学中说过,归一化后-0.3到0.3的数据是极好的。肉眼看是没什么区分度,但是当你的数据特征维度稍大一些,比如十维,二十维,三十维,那么在对应的维度空间里,样本和样本之间的距离还是很大的。
采纳该答案 已采纳该答案 专家已采纳评论解决 无用打赏举报微信扫一扫
分享评论登录 后可回复...
报告相同问题?
提交
相关推荐 更多相似问题
- 2019-09-05 11:16回答 1 已采纳 在吴恩达的机器学习教学中说过,归一化后-0.3到0.3的数据是极好的。肉眼看是没什么区分度,但是当你的数据特征维度稍大一些,比如十维,二十维,三十维,那么在对应的维度空间里,样本和样本之间的距离还是很
- 2022-02-07 01:05回答 1 已采纳 直接加载模型然后对新数据集进行预测啊,结果就是0或者1,然后把结果按照之前训练的数据集格式写入一个新的csv,这就是相当于打上标签了,但是这个标签不一定是全部对的,除非你能保证你的模型推理结果一定是正
- 回答 1 已采纳 分割数据集到训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(x, y) 你加载模型直接预测 不需要对数据进行再
- 2021-08-28 20:35科研小站的博客 由于实际收集到的机器学习数据集不可避免的会存在数据缺、数据集不平衡和数据集中各类数据非同一量级等情况,对缺失数据进行补全和对异常数据进行清洗、均衡化处理防止类别不平衡和数据标准化处理对于机器学习模型至...
- 2019-11-02 09:36june_francis的博客 熟悉数据挖掘和机器学习的小伙伴们都知道,数据处理相关的工作时间占据了整个项目的70%以上。数据的质量,直接决定了模型的预测和泛化能力的好坏。它涉及很多因素,包括:准确性、完整性、一致性、时效性、可信性和...
- 2022-04-17 17:56TingXiao-Ul的博客 为什么要标准化处理?什么情况下需要对数据标准化处理? 哪些模型对标准化处理比较敏感?
- 2019-04-28 20:32回答 2 已采纳 可以进行多目标,比如在回归问题中,决策树和神经网络就可以同时预测多个目标值。 可以参考论文,A survey on multi‐output regression
- 2021-10-14 00:30回答 1 已采纳 跟你训练集有关吧,检查下X-train
- 2019-11-07 07:01回答 1 已采纳 首先,不建议这么做,如果把train和test都用来训练,没测试集来看效果。 如果真要这么做,可以在训练前先把两个文件合并再投入训练
- 2020-03-05 10:46百木从森的博客 数据与处理与特征工程 概念:数据预处理与特征工程泛指对训练数据集进行特征增加、... 特征变换:预处理、标准化、纠偏 特征增加与删减:特征降维与变量扩展 模型评价体系 ...
- 2021-07-19 19:08ogr_mpwf的博客 文章目录一、概述1.1数据预处理和特征工程1.2sklearn中数据预处理和特征工程二、数据预处理2.1数据无量纲化2.2缺失值 一、概述 1.1数据预处理和特征工程 1、数据挖掘五大流程: 获取数据 数据预处理 (1)定义:...
- 2019-01-06 19:32MXuDong的博客 这篇主要是关于机器学习中的数据预处理的scaler变化。 工作中遇到的问题是:流量预测问题,拿到的数据差距非常大,凌晨的通话流量很少几乎为0;但是在早上8点以后数据就会激增最高常常是500以上的情况。 通常,在...
- 2022-04-29 09:25回答 2 已采纳 选特征,打标签,调sklearn 包训练,预测,结束
- 2022-05-12 00:29回答 3 已采纳 这个np的线性回归就行了。深度学习感觉用了牛刀
- 2019-09-11 08:50回答 2 已采纳 ``` # 1. # 交叉验证进行最优模型选择 from sklearn.model_selection import cross_val_score model = RandomFore
- 2017-04-17 17:16marsjhao的博客 在工程实践中,我们得到的数据会存在有缺失值、重复值等,在使用之前需要进行数据预处理。数据预处理没有标准的流程,通常针对不同的任务和数据集属性的不同而不同。数据预处理的常用流程为:去除唯一属性、处理缺失...
- 2021-02-06 20:17菜鸟小_pu的博客 机器学习-数据预处理 1.概述 1.1数据挖掘的五大流程 获取数据 数据预处理:从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,...
- 2020-01-03 12:36会飞的犬良的博客 熟悉数据挖掘和机器学习的小伙伴们都知道,数据处理相关的工作时间占据了整个项目的70%以上。数据的质量,直接决定了模型的预测和泛化能力的好坏。它涉及很多因素,包括:准确性、完整性、一致性、时效性、可信性和...
- 2022-04-13 21:24回答 1 已采纳 import pandas as pd import numpy as np data = pd.DataFrame({ 'a': [np.nan, 1, np.nan, 2, 3, np.
- 2019-12-03 00:42郑德帅的博客 特征预处理就是通过一些转化函数将特征数据转换成更加适合算法模型的特征数据过程(无量纲化处理) 2.预处理方法 : 归一化+标准化 3.预处理API: sklearn.preprocessing 4.数据的标准化(normalization)和...
- 没有解决我的问题, 去提问