线性回归问题进行特征缩放后，为什么求得的参数不对了

正在学习线性回归问题，选取的是房价和面积的线性关系。训练数据9组。
h(x)= a*x+b
通过【正规方程法】求得 a=5.8, b=-111
通过【梯度下降法】分别设置a和b的学习率
lr_a =0.000016
lr_b =0.01
迭代2000次也能求得近似 a=5.8, b=-111

但是进行归一化特征缩放后，a=4.8，而b的值每次运行都不一样，代价函数依然能收敛，这是为什么？刚学到线性回归，求通俗解答。

# 导入numpy
import numpy as np
# 导入pandas库
import pandas as pd
# 导入绘图库
from matplotlib import pyplot as plt

# 读取excel文件
df = pd.read_excel('house_price.xlsx')

# 将df某列转化为numpy格式
area = df['Size'].to_numpy()
price = df['Price'].to_numpy()


# 定义归一化方法
def normalize(array):
    min_value = np.min(array)
    max_value = np.max(array)
    return (array - min_value) / (max_value - min_value)


# 对原数据进行归一化
x = normalize(area)
# 为了形式统一，我们虽然定义了y，但注意不要对y进行处理
y = price
print(x)

# 使用平方/均方误差作为代价函数
def cost_function(a,b):
    cost = np.sum((a * area + b - price) ** 2)
    return cost

def cost_avg_function(a,b):
    cost_avg = np.sum((a * area+b - price) ** 2)/len(area)
    return cost_avg


# 计算梯度
def grad_a_func(a,b):
    grad_a = np.sum((a * area + b - price) * area)
    return grad_a

def grad_b_func(a,b):
    grad_b = np.sum(a * area + b - price)
    return grad_b



# 定义超参数
# 学习率
lr = 0.000016
# 迭代次数
epoch = 1000

# 创建一个数组，记录每一次迭代时的代价，用于最后绘图
cost_log = np.empty(epoch)

# 为待训练参数生成随机初始值
a1 = np.random.randint(10)
b1 = np.random.randint(10)

# 开始迭代
for e in range(epoch):
    cost = cost_function(a1, b1)
    # 分别计算两个方向上的梯度
    gradient_a = grad_a_func(a1, b1)
    gradient_b = grad_b_func(a1, b1)
    # 同时更新a1和b1
    a1 = a1 - lr * gradient_a
    b1 = b1 - lr * gradient_b
    # 记录本次迭代的代价
    cost_log[e] = cost
    print(f'当前迭代第{e}次：cost={cost}，a={a1}，b={b1}')

# 绘制图形
plt.title('Cost Function Curve')
plt.xlabel('Epoch')
plt.ylabel('Cost')
plt.plot(np.arange(epoch), cost_log)
plt.show()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

小逸2023 2023-03-28 10:31

关注

该回答引用ChatGPT
在进行特征缩放后，求得的参数不正确的原因可能是学习率设置不合适。特征缩放后，不同特征的取值范围不同，如果学习率设置过大，可能会导致梯度下降算法在更新参数时跨越太大的步长，错过了最优解。因此，需要适当减小学习率，以保证算法能够收敛到正确的解。
此外，b的值每次运行都不一样，可能是因为梯度下降算法的随机性导致的。在每次迭代时，梯度下降算法都会随机选择一个样本进行更新，因此每次运行时选择的样本不同，可能会导致b的值不同。但是，如果代价函数能够收敛，说明算法已经找到了一个比较好的解，因此b的值的变化不会影响最终的结果。
下面是修改后的代码，其中将学习率调整为较小的值，以保证算法能够收敛到正确的解。


# 导入numpy
import numpy as np
# 导入pandas库
import pandas as pd
# 导入绘图库
from matplotlib import pyplot as plt
# 读取excel文件
df = pd.read_excel('house_price.xlsx')
# 将df某列转化为numpy格式
area = df['Size'].to_numpy()
price = df['Price'].to_numpy()
# 定义归一化方法
def normalize(array):
    min_value = np.min(array)
    max_value = np.max(array)
    return (array - min_value) / (max_value - min_value)
# 对原数据进行归一化
x = normalize(area)
# 为了形式统一，我们虽然定义了y，但注意不要对y进行处理
y = price
# 使用平方/均方误差作为代价函数
def cost_function(a,b):
    cost = np.sum((a * area + b - price) ** 2)
    return cost
def cost_avg_function(a,b):
    cost_avg = np.sum((a * area+b - price) ** 2)/len(area)
    return cost_avg
# 计算梯度
def grad_a_func(a,b):
    grad_a = np.sum((a * area + b - price) * area)
    return grad_a
def grad_b_func(a,b):
    grad_b = np.sum(a * area + b - price)
    return grad_b
# 定义超参数
# 学习率
lr_a = 0.01
lr_b = 0.001
# 迭代次数
epoch = 2000
# 创建一个数组，记录每一次迭代时的代价，用于最后绘图
cost_log = np.empty(epoch)
# 为待训练参数生成随机初始值
a1 = np.random.randint(10)
b1 = np.random.randint(10)
# 开始迭代
for e in range(epoch):
    cost = cost_function(a1, b1)
    # 分别计算两个方向上的梯度
    gradient_a = grad_a_func(a1, b1)
    gradient_b = grad_b_func(a1, b1)
    # 同时更新a1和b1
    a1 = a1 - lr_a * gradient_a
    b1 = b1 - lr_b * gradient_b
    # 记录本次迭代的代价
    cost_log[e] = cost
    print(f'当前迭代第{e}次：cost={cost}，a={a1}，b={b1}')
# 绘制图形
plt.title('Cost Function Curve')
plt.xlabel('Epoch')
plt.ylabel('Cost')
plt.plot(np.arange(epoch), cost_log)
plt.show()

报告相同问题？

关注问题

使用sklearn进行线性回归时遇到的问题 python sklearn 线性回归
2023-02-13 20:39

回答 3 已采纳基于Monster 组和GPT的调写：使用 Scikit-learn 的机器学习模型时，通常都是先实例化一个模型对象，然后再调用其 fit 方法来拟合模型。如果直接调用 LinearRegressio
逻辑树与线性回归的结合使用什么算法？ python 决策树线性回归
2022-01-11 08:56

回答 5 已采纳你的意思是决策树的结果是不同的线性回归函数，例如简单地不同斜率的直线，那么以上回答的思路似乎有问题。首先这是一个分类问题，决策结果是“第k个回归函数“，然后再用 “第k个回归函数“ 计算得到具体的函
【R语言】加权线性回归模型，PSU问题 r语言线性回归
2023-03-01 23:28

回答 1 已采纳其中一个层（第 65 层）中只有一个 PSU（主要抽样单位），这导致调查设计出现问题。你参考一下这个： # Filter out Stratum 65 d_rec_filtered <- d_r
机器学习之线性回归理论与代码实践
2021-06-13 10:37

对于多元线性回归（包含多个自变量），模型变为y = θ^T * x，其中θ是一个参数向量，x是特征向量。最小化目标函数J(θ) = (1/n) * ∑(hθ(x_i) - y_i)^2，其中hθ(x)是预测函数，n是样本数量。 Ridge回归，也称为...
关于Python#线性回归#中遇到的syntax error问题，如何解决？ python 机器学习线性回归
2023-01-31 11:42

回答 4 已采纳可以尝试将 w[0] = bias 改为 weight[0] = bias。
线性回归/拟合直线如何去除离群点/噪声？最小二乘法线性回归
2022-03-21 16:44

回答 1 已采纳拟合的时候可以加一点惩罚因子，意思就是可以允许有一两个错误点，这样可以避免离群点，这也是正则化的思想，你可以搜搜拉格朗日优化。
线性回归，回答正确加酬金（我开设了几个问题） python 机器学习线性回归
2022-07-09 10:14

回答 2 已采纳梯度优化的时候训练参数值没发计算，加个数据归一化处理。
人工智能机器学习算法总结--1.线性回归算法(单变量及多变量)
2024-03-20 10:42

人工智能小豪的博客 线性回归算法的目的是建立一个线性模型，用来描述自变量（输入特征）和因变量（输出）之间的关系。
请问python建模-线性回归，每运行一次，r2值会变化吗 python 机器学习线性回归
2021-12-23 16:40

回答 1 已采纳肯定会变化，这是正常现象，是因为你没有指定随机种子，所以每次训练的参数初始化是不同的。导致分数不同
线性回归数组行数不对应 python 机器学习线性回归
2022-07-09 20:37

回答 1 已采纳我没太看明白你取得那6个特征，x0、2、5不都是常量吗x1和x3是一次函数，x4是二次函数，这个是否用3个特征就可以了，你最后想要的效果是要一个二次函数去拟合你原本图片中的那条线吗？我用你其中一张图片
求..如何使用python 线性回归参数来预测保险费随年龄的变化 python 有问必答线性回归
2021-10-22 18:54

回答 1 已采纳参考这个链接里的文章：一文教你全面掌握用Python实现线性回归 - 知乎全文共 4968字，预计学习时长15分钟或更长本文旨在为读
【机器学习】线性回归（超详细）
2022-01-31 18:13

李思雨.lsy的博客机器学习之线性回归，看懂这一篇就够了(超详细)。
关于线性回归的一些理解，希望可以下纠正错误 python 有问必答算法线性回归
2021-11-09 00:31

回答 1 已采纳仅限我个人的理解:首先你有一个优化函数和一组训练数据,优化函数中有一系列待确定的参数,你的目的就是让优化函数在训练数据中取得一个局部最优解也就是说计算出一组参数,将参数代入模型之后,模型可以尽可能的符
AI算法12-线性回归算法Linear Regression | LR
2024-07-12 10:18

西土瓦110的博客 线性回归算法是一种基于假设自变量和因变量之间存在线性关系的统计学习方法。也就是说，我们认为因变量y可以表示为自变量x的线性组合加上一个随机误差项。例如，如果我们有一个自变量x和一个因变量y，那么我们可以...
实验二：线性回归
2023-10-08 11:15

变废为宝123的博客观察预测结果的均方误差，我们可以得知使用梯度下降法求得的MSE还是在误差允许范围内的，所以我们使用梯度下降法所得到的三元线性回归方程的拟合度还是比较高的。观察预测结果的均方误差，我们可以得知使用矩阵求...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月28日

悬赏问题

¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载

线性回归问题进行特征缩放后，为什么求得的参数不对了

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新