机器学习中怎么使用保存的模型进行预测

我使用一个文档中的数据训练了岭回归模型并保存，想通过这个模型来预测另一个文档中的数据（两个文档中的数据只是数量不一样）

预测的文档中有2W+条数据，但是预测结果只有6000+条。

请问各位大神怎么才能使预测结果按每条数据的顺序全部得出来。

本人完全小白，论文想做个机器学习的东西...求各位大神指导

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import pandas as pd
import joblib as jb

def mylinear():
    """
    岭回归预测TOC
    :return: None
    """
    # 获取数据
    data = pd.read_csv("./NH25-4.csv")
    # 删除部分列
    data = data.drop(["E_HORZ", "E_VERT", "PR_HORZ", "PR_VERT", "Brittle_Horz%", "Brittle_Vert%", "POR", "DEPTH"],
                     axis=1)

    # 取出特征值和目标值
    y = data["TOC"]
    x = data.drop(["TOC"], axis=1)

    # 分割数据集到训练集和测试集
    x_train, x_test, y_train, y_test = train_test_split(x, y)

    # 标准化
    std_x = StandardScaler()

    x_train = std_x.fit_transform(x_train)
    x_test = std_x.transform(x_test)

    # 目标值
    std_y = StandardScaler()

    y_train = std_y.fit_transform(y_train.values.reshape(-1, 1))
    y_test = std_y.transform(y_test.values.reshape(-1, 1))

    # 加载模型
    model = jb.load("./test_Ridge.pkl")
    y_predict = std_y.inverse_transform(model.predict(x_test))

    print("保存的模型预测的结果：", y_predict)

if __name__ == "__main__":
    mylinear()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
繁华三千东流水 2019-09-02 18:21
关注
分割数据集到训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x, y)
你加载模型直接预测不需要对数据进行再次切分因为你切分为了训练集和测试集，所有测试集只有6000+数据。你对数据处理的时候直接对整体进行处理
然后整体预测就可以了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 5

无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

机器学习中怎么使用保存的模型进行预测 python 数据挖掘机器学习深度学习神经网络
2019-09-02 17:37

回答 1 已采纳分割数据集到训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(x, y) 你加载模型直接预测不需要对数据进行再
机器学习 训练汽车销量预测模型机器学习
2022-06-01 10:23

回答 1 已采纳 import pandas as pd import re import numpy as np from sklearn.ensemble import RandomForestRegressor
如何调用训练好的机器学习模型处理新数据集？人工智能数据挖掘机器学习
2022-02-07 01:05

回答 1 已采纳直接加载模型然后对新数据集进行预测啊，结果就是0或者1，然后把结果按照之前训练的数据集格式写入一个新的csv，这就是相当于打上标签了，但是这个标签不一定是全部对的，除非你能保证你的模型推理结果一定是正
机器学习之使用随机森林回归模型进行cpu占有率预测
2023-08-31 09:10

然后，从另一个CSV文件读取测试数据，对测试数据进行相同的编码处理，利用训练好的模型预测虚拟机行为（平均值），将结果逐行输出，并创建DataFrame和CSV文件以保存预测结果。代码旨在分析虚拟机行为并提供可用于...
机器学习构建预测模型怎么以网页版呈现？ python 机器学习算法
2023-01-25 13:56

回答 3 已采纳望采纳：XGBoost算法构建的预测模型可以通过使用一些web框架来在网页上呈现。具体步骤可以是:1.使用一个web框架如 Flask 建立一个网站后端2.在网站后端中加载已经训练好的XGBoost模
机器学习中，能不能对多个目标进行预测？数据挖掘机器学习深度学习
2019-04-28 20:32

回答 2 已采纳可以进行多目标，比如在回归问题中，决策树和神经网络就可以同时预测多个目标值。可以参考论文，A survey on multi‐output regression
深度学习使用joblib保存模型报错can't pickle weakref objects python 机器学习深度学习
2022-07-02 15:32

回答 1 已采纳你试试看下保存成pkl格式看看，感觉应该是格式的问题
基于机器学习回归模型对广州二手房价格进行分析及模型评估项目源码
2022-04-06 16:29

3、基于机器学习回归模型对广州二手房价格进行分析及模型评估.ipynb是文章《基于机器学习回归模型对广州二手房价格进行分析及模型评估》中所用到的所有的代码，需要用jupyter notebook打开运行 4、配合博文《基于...
预测播放量——应采取什么样的机器学习模型 python 大数据机器学习
2023-02-16 16:43

回答 3 已采纳选择随机森林模型来进行预测。因为你的数据集比较小，而且我们关注的是预测准确率和鲁棒性，随机森林可以有效地避免过拟合问题，并且相对于其他模型，它的计算复杂度也不是很高。
机器学习使用xgboost模型，报错：输入的数据有inf和nan？ python 机器学习深度学习
2023-01-29 20:23

回答 2 已采纳 XGBoost 默认是不能处理包含 inf 和 nan 的数据的，你需要先检测并处理掉数据中的无穷大或非数字值。如果数据确实包含过大的浮点数导致了此类问题，你可以考虑对数据进行对数处理来减小数值的范
在机器学习建立预测模型中，使用Bootstrap法，还需要划分训练集，验证集吗? 机器学习
2023-03-15 11:26

回答 2 已采纳这篇博客: 机器学习数据集（训练集、测试集）划分方法中的自助法(bootstrap) 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读: 以自助采样为基础，每次随机有放回的从
人工智能-机器学习-口碑预测-IJCAI-17 口碑商家客流量预测
2022-07-09 15:31

将商店中的地址、三级分类等名词映射成Id保存在该文件夹下。 statistics 原始数据处理后的数据，包括平滑后的数据，天气数据和天气统计。 test_train 存储线下线上train和test的特征以及标签文件。 weekABCD 线...
关于机器学习模型调参的正确步骤是怎样的？人工智能数据挖掘机器学习深度学习
2019-09-11 08:50

回答 2 已采纳 ``` # 1. # 交叉验证进行最优模型选择 from sklearn.model_selection import cross_val_score model = RandomFore
使用训练好的模型进行预测
2019-02-28 10:26

使用训练好的模型进行预测，可以与我的模型训练和保存配套使用
【机器学习】集成模型/集成学习：多个模型相结合实现更好的预测
2023-10-20 15:23

TwcatL_tree的博客我们通过一个例子来理解集成学习的概念。假设你是一名电影导演，你依据一个非常重要且有趣的话题创作了一部短片。现在，你想在公开发布前获得影片的初步反馈（评级）。有哪些可行的方法呢？A：可以请一位朋友为电影...
没有解决我的问题, 去提问

悬赏问题

¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog
¥15 Excel发现不可读取的内容