关于归一化和numpy.log处理数据的疑问

在数据挖掘中, 有对数据进行归一化处理，比如StandardNormalization, 这种归一化处理的
好处是对异常的离散数值有很好的效果, 而numpy.log 可以对一些离散的异常数值有这种处理,
经过这种log处理后，得到的直方图更接近高斯分布, 我的问题是：
1. 我在网上看到一些大数据挖掘方面的资料，利用LogisticRegressor, 并没有对数据进行
归一化处理, 这种归一化是否不一定必须的？
2. 如果采用了 StandardNormalization 这种归一化处理，是否也相当于采用了Log处理的效果，而且数值被限定在更小的范围之内？
3. 数据挖掘中，如果用到 LogisticRegressor这种算法，是否直接对那些离散值直接进行StandardNormalization处理，不用采用Log处理？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-08-25 01:21
关注
(1)是不是必须的要看你的算法。比如说你用了sigmoid之类的激活函数来实现非线性，如果你的数据偏离原点很远，那么就学不起来。就需要归一化。总之，和你的机器学习的算法有关，有的的确差异不大。
(2)不是，标准归一化是将数据按照正态分布处理，均值为0，方差为1，不是指数归一化。
(3)逻辑回归用StandardNormalization就可以了，最好使用修正正切（ReLU）之类的非线性函数。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

No module named 'numpy.typing' python 个人开发
2022-05-22 09:13

回答 2 已采纳没有安装 numpy 库，从清华镜像站上下载安装速度比较快速，不容易超时报错： pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simp
TypeError: 'numpy.float64' object is not callable python 有问必答机器学习
2022-10-10 16:23

回答 5 已采纳这里啊
如何解决numpy.ndarray' object is not callable python 人工智能数据挖掘机器学习深度学习
2019-09-14 21:42

回答 1 已采纳 https://blog.csdn.net/Olaking/article/details/43199003?locationNum=15
数据预处理之归一化和标准化
2020-07-02 16:32

taon1607的博客 1、把数变为（0，1）之间的小数，主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速。 2、把有量纲表达式变为无量纲表达式 归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，...
AttributeError: 'numpy.ndarray' object has no attribute 'split' python 机器学习深度学习
2022-03-28 10:20

回答 2 已采纳 max([len(x.split(" ")) for x in x_data])，你的x的数据类型可能是numpy，她是没有.split属性的，你把x转换为字符串，如str(x)
AttributeError: numpy.ndarray object has no attribute numpy python
2022-05-09 23:54

回答 1 已采纳为么要用数组变量调用numpy函数，numpy是个库啊，不是函数
AttributeError: 'numpy.ndarray' object has no attribute 'toarray' python sklearn 有问必答机器学习
2022-04-26 05:38

回答 2 已采纳之前TruncatedSVD.transform返回一个数组，而不是稀疏矩阵，所以不能用toarray
数据预处理—数据归一化/标准化
2023-06-21 11:09

入锅的小麻圆的博客以上就是的数据归一化和标准化比较常用的处理方式，相对于归一化，我个人是更喜欢用标准化的，因为归一化更容易受到异常值的影响，而标准化相对来说更稳定，标准化后的数据符合标准正态分布，从统计学上说也是数据...
numpy.core._exceptions._UFuncNoLoopError: ufunc 'add' did not contain a loop with signature python
2022-07-28 13:49

回答 3 已采纳下有代码，可直接复制使用。如有帮助，敬请采纳，你的采纳是我前进的动力，O(∩_∩)O谢谢！！！！！！！！路过的朋友也可以点个赞~(≧▽≦)/~ import pandas as pd import n
python报错TypeError: 'numpy.float64' object is not iterable python 有问必答
2021-09-09 16:37

回答 3 已采纳单独打印这里看一下形状? 报错是说你把一个单值llst化了,我记得numpy应该有自己的tolist函数
导入cv2报错ImportError: numpy.core.multiarray failed to import怎么办 opencv python 计算机视觉
2022-05-14 10:56

回答 1 已采纳升级一下numpy试试：pip install -U numpy
【深度学习实验】网络优化与正则化（六）：逐层归一化方法——批量归一化、层归一化、权重归一化、局部响应归一化
2023-11-16 20:33

QomolangmaH的博客本文介绍了神经网络优化的逐层归一化方法，包括批量归一化、层归一化、权重归一化（略）、局部响应归一化（略）等内容
ubunt no module named numpy.core python
2022-08-03 11:05

回答 4 已采纳解决方法直接安装指定兼容的版本试下 python -m pip install numpy==1.23.1 python -m pip install scipy==1.9.0 因为具体哪个版本兼容
深度学习中的数据归一化
2020-12-14 13:41

柠檬巧克力、的博客最近在做低氧舱滞后时间模拟的项目中遇到了输入数据量纲不同的情况，使用归一化和直接学习对比的情况发现训练结果大有不同。因此记录一下。 归一化作用基本原理实现方法什么时候需要归一化实例：归一化前后数据训练...
机器学习中的归一化和python计算
2020-02-12 14:29

vivian_ll的博客一、数据不平衡　在学术研究与教学中，很多算法都有一个基本假设，那就是数据分布是均匀的。当我们把这些算法直接应用于实际数据时，大多数情况下都无法取得理想的结果。因为实际数据往往分布得很不均匀，都会存在...
没有解决我的问题, 去提问

悬赏问题

¥15 vc6.0中想运行代码的时候总是提示无法打开文件是怎么回事
¥25 关于##爬虫##的问题，如何解决?:
¥15 ZABBIX6.0L连接数据库报错，如何解决？(操作系统-centos)
¥15 找一位技术过硬的游戏pj程序员
¥15 matlab生成电测深三层曲线模型代码
¥50 随机森林与房贷信用风险模型
¥50 buildozer打包kivy app失败
¥30 在vs2022里运行python代码
¥15 不同尺寸货物如何寻找合适的包装箱型谱
¥15 求解 yolo算法问题