机器学习中怎么使用保存的模型进行预测

我使用一个文档中的数据训练了岭回归模型并保存，想通过这个模型来预测另一个文档中的数据（两个文档中的数据只是数量不一样）

预测的文档中有2W+条数据，但是预测结果只有6000+条。

请问各位大神怎么才能使预测结果按每条数据的顺序全部得出来。

本人完全小白，论文想做个机器学习的东西...求各位大神指导

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import pandas as pd
import joblib as jb

def mylinear():
    """
    岭回归预测TOC
    :return: None
    """
    # 获取数据
    data = pd.read_csv("./NH25-4.csv")
    # 删除部分列
    data = data.drop(["E_HORZ", "E_VERT", "PR_HORZ", "PR_VERT", "Brittle_Horz%", "Brittle_Vert%", "POR", "DEPTH"],
                     axis=1)

    # 取出特征值和目标值
    y = data["TOC"]
    x = data.drop(["TOC"], axis=1)

    # 分割数据集到训练集和测试集
    x_train, x_test, y_train, y_test = train_test_split(x, y)

    # 标准化
    std_x = StandardScaler()

    x_train = std_x.fit_transform(x_train)
    x_test = std_x.transform(x_test)

    # 目标值
    std_y = StandardScaler()

    y_train = std_y.fit_transform(y_train.values.reshape(-1, 1))
    y_test = std_y.transform(y_test.values.reshape(-1, 1))

    # 加载模型
    model = jb.load("./test_Ridge.pkl")
    y_predict = std_y.inverse_transform(model.predict(x_test))

    print("保存的模型预测的结果：", y_predict)

if __name__ == "__main__":
    mylinear()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
繁华三千东流水 2019-09-02 18:21
关注
分割数据集到训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x, y)
你加载模型直接预测不需要对数据进行再次切分因为你切分为了训练集和测试集，所有测试集只有6000+数据。你对数据处理的时候直接对整体进行处理
然后整体预测就可以了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 5

无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

机器学习中怎么使用保存的模型进行预测 python 数据挖掘机器学习深度学习神经网络
2019-09-02 17:37

回答 1 已采纳分割数据集到训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(x, y) 你加载模型直接预测不需要对数据进行再
机器学习 训练汽车销量预测模型机器学习
2022-06-01 10:23

回答 1 已采纳 import pandas as pd import re import numpy as np from sklearn.ensemble import RandomForestRegressor
如何调用训练好的机器学习模型处理新数据集？人工智能数据挖掘机器学习
2022-02-07 01:05

回答 1 已采纳直接加载模型然后对新数据集进行预测啊，结果就是0或者1，然后把结果按照之前训练的数据集格式写入一个新的csv，这就是相当于打上标签了，但是这个标签不一定是全部对的，除非你能保证你的模型推理结果一定是正
机器学习之使用随机森林回归模型进行cpu占有率预测
2023-08-31 09:10

然后，从另一个CSV文件读取测试数据，对测试数据进行相同的编码处理，利用训练好的模型预测虚拟机行为（平均值），将结果逐行输出，并创建DataFrame和CSV文件以保存预测结果。代码旨在分析虚拟机行为并提供可用于...
机器学习构建预测模型怎么以网页版呈现？ python 机器学习算法
2023-01-25 13:56

回答 3 已采纳望采纳：XGBoost算法构建的预测模型可以通过使用一些web框架来在网页上呈现。具体步骤可以是:1.使用一个web框架如 Flask 建立一个网站后端2.在网站后端中加载已经训练好的XGBoost模
机器学习中，能不能对多个目标进行预测？数据挖掘机器学习深度学习
2019-04-28 20:32

回答 2 已采纳可以进行多目标，比如在回归问题中，决策树和神经网络就可以同时预测多个目标值。可以参考论文，A survey on multi‐output regression
深度学习使用joblib保存模型报错can't pickle weakref objects python 机器学习深度学习
2022-07-02 15:32

回答 1 已采纳你试试看下保存成pkl格式看看，感觉应该是格式的问题
基于机器学习回归模型对广州二手房价格进行分析及模型评估项目源码
2022-04-06 16:29

3、基于机器学习回归模型对广州二手房价格进行分析及模型评估.ipynb是文章《基于机器学习回归模型对广州二手房价格进行分析及模型评估》中所用到的所有的代码，需要用jupyter notebook打开运行 4、配合博文《基于...
预测播放量——应采取什么样的机器学习模型 python 大数据机器学习
2023-02-16 16:43

回答 3 已采纳选择随机森林模型来进行预测。因为你的数据集比较小，而且我们关注的是预测准确率和鲁棒性，随机森林可以有效地避免过拟合问题，并且相对于其他模型，它的计算复杂度也不是很高。
机器学习使用xgboost模型，报错：输入的数据有inf和nan？ python 机器学习深度学习
2023-01-29 20:23

回答 2 已采纳 XGBoost 默认是不能处理包含 inf 和 nan 的数据的，你需要先检测并处理掉数据中的无穷大或非数字值。如果数据确实包含过大的浮点数导致了此类问题，你可以考虑对数据进行对数处理来减小数值的范
在机器学习建立预测模型中，使用Bootstrap法，还需要划分训练集，验证集吗? 机器学习
2023-03-15 11:26

回答 2 已采纳这篇博客: 机器学习数据集（训练集、测试集）划分方法中的自助法(bootstrap) 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读: 以自助采样为基础，每次随机有放回的从
人工智能-机器学习-口碑预测-IJCAI-17 口碑商家客流量预测
2022-07-09 15:31

将商店中的地址、三级分类等名词映射成Id保存在该文件夹下。 statistics 原始数据处理后的数据，包括平滑后的数据，天气数据和天气统计。 test_train 存储线下线上train和test的特征以及标签文件。 weekABCD 线...
关于机器学习模型调参的正确步骤是怎样的？人工智能数据挖掘机器学习深度学习
2019-09-11 08:50

回答 2 已采纳 ``` # 1. # 交叉验证进行最优模型选择 from sklearn.model_selection import cross_val_score model = RandomFore
使用训练好的模型进行预测
2019-02-28 10:26

使用训练好的模型进行预测，可以与我的模型训练和保存配套使用
机器学习——KNN算法/机器学习模型的保存和加载
2023-08-27 20:22

疋瓞的博客 KNN算法是机器学习算法中用于分类或者回归的算法，KNN全称为K nearest neighbour（又称为K-近邻算法）原理：K-近邻算法采用测量不同特征值之间的距离的方法进行分类。可以看出，曼哈顿距离计算复杂度较低，计算速度...
没有解决我的问题, 去提问

悬赏问题

¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题

机器学习中怎么使用保存的模型进行预测

1条回答 默认 最新

悬赏问题

1条回答默认最新