问题遇到的现象和发生背景
回归分析任务
任务 1
数据(文件regres.txt)(数据见下面代码块)代表了21天内对氨氧化法硝酸生产过程的四个参数的测量。
氨氧化法的硝酸生产过程的四个参数。
X(1) - (air speed)空气速度。
X(2)-( temperature of the cooled liquid)是冷却后的液体温度。
X(3)-(acid concentration)酸浓度。
X(4) - (loss of ammonia)氨的损失。
变量X(4)是因变量,变量X(1)、X(2)X(3)是独立变量。
1 确定哪些自变量是高度相关的。
2. 确定哪些自变量与因变量高度相关。
3. 建立一个多元线性回归方程,确定哪些自变量是显著的。
4. 使用逐步回归法,选择有信息的变量。
5.分析残留物。
6.构建因变量的预测,将第4天的数值作为自变量的数值。
任务2
1.建立岭回归模型(Ridge Regression Model)
2. 建立拉索回归模型( Lasso Regression Model)
3. 构建每个模型的因变量预测,将第四天的数值作为自变量。
将第四天的数值作为自变量的数值。
数据(文件regres.txt)
80.00000 27.00000 89.00000 42.00000
80.00000 27.00000 88.00000 37.00000
75.00000 25.00000 90.00000 37.00000
62.00000 24.00000 87.00000 28.00000
62.00000 22.00000 87.00000 18.00000
62.00000 23.00000 87.00000 18.00000
62.00000 24.00000 93.00000 19.00000
62.00000 24.00000 93.00000 20.00000
58.00000 23.00000 87.00000 15.00000
58.00000 18.00000 80.00000 14.00000
58.00000 18.00000 89.00000 14.00000
58.00000 17.00000 88.00000 13.00000
58.00000 18.00000 82.00000 11.00000
58.00000 19.00000 93.00000 12.00000
50.00000 18.00000 89.00000 8.00000
50.00000 18.00000 86.00000 7.00000
50.00000 19.00000 72.00000 8.00000
50.00000 19.00000 79.00000 8.00000
50.00000 20.00000 80.00000 9.00000
56.00000 20.00000 82.00000 15.00000
70.00000 20.00000 91.00000 15.00000
我想要达到的结果
使用Python和Jupyter notebook编写,完成任务要求,写一下注释