机器学习中怎么使用保存的模型进行预测

我使用一个文档中的数据训练了岭回归模型并保存，想通过这个模型来预测另一个文档中的数据（两个文档中的数据只是数量不一样）

预测的文档中有2W+条数据，但是预测结果只有6000+条。

请问各位大神怎么才能使预测结果按每条数据的顺序全部得出来。

本人完全小白，论文想做个机器学习的东西...求各位大神指导

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import pandas as pd
import joblib as jb

def mylinear():
    """
    岭回归预测TOC
    :return: None
    """
    # 获取数据
    data = pd.read_csv("./NH25-4.csv")
    # 删除部分列
    data = data.drop(["E_HORZ", "E_VERT", "PR_HORZ", "PR_VERT", "Brittle_Horz%", "Brittle_Vert%", "POR", "DEPTH"],
                     axis=1)

    # 取出特征值和目标值
    y = data["TOC"]
    x = data.drop(["TOC"], axis=1)

    # 分割数据集到训练集和测试集
    x_train, x_test, y_train, y_test = train_test_split(x, y)

    # 标准化
    std_x = StandardScaler()

    x_train = std_x.fit_transform(x_train)
    x_test = std_x.transform(x_test)

    # 目标值
    std_y = StandardScaler()

    y_train = std_y.fit_transform(y_train.values.reshape(-1, 1))
    y_test = std_y.transform(y_test.values.reshape(-1, 1))

    # 加载模型
    model = jb.load("./test_Ridge.pkl")
    y_predict = std_y.inverse_transform(model.predict(x_test))

    print("保存的模型预测的结果：", y_predict)

if __name__ == "__main__":
    mylinear()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
繁华三千东流水 2019-09-02 18:21
关注
分割数据集到训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x, y)
你加载模型直接预测不需要对数据进行再次切分因为你切分为了训练集和测试集，所有测试集只有6000+数据。你对数据处理的时候直接对整体进行处理
然后整体预测就可以了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 5

无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

机器学习 训练汽车销量预测模型机器学习
2022-06-01 10:23

回答 1 已采纳 import pandas as pd import re import numpy as np from sklearn.ensemble import RandomForestRegressor
如何调用训练好的机器学习模型处理新数据集？人工智能数据挖掘机器学习
2022-02-07 01:05

回答 1 已采纳直接加载模型然后对新数据集进行预测啊，结果就是0或者1，然后把结果按照之前训练的数据集格式写入一个新的csv，这就是相当于打上标签了，但是这个标签不一定是全部对的，除非你能保证你的模型推理结果一定是正
机器学习构建预测模型怎么以网页版呈现？ python 机器学习算法
2023-01-25 13:56

回答 3 已采纳望采纳：XGBoost算法构建的预测模型可以通过使用一些web框架来在网页上呈现。具体步骤可以是:1.使用一个web框架如 Flask 建立一个网站后端2.在网站后端中加载已经训练好的XGBoost模
机器学习之使用随机森林回归模型进行cpu占有率预测
2023-08-31 09:10

然后，从另一个CSV文件读取测试数据，对测试数据进行相同的编码处理，利用训练好的模型预测虚拟机行为（平均值），将结果逐行输出，并创建DataFrame和CSV文件以保存预测结果。代码旨在分析虚拟机行为并提供可用于...
机器学习中，能不能对多个目标进行预测？数据挖掘机器学习深度学习
2019-04-28 20:32

回答 2 已采纳可以进行多目标，比如在回归问题中，决策树和神经网络就可以同时预测多个目标值。可以参考论文，A survey on multi‐output regression
深度学习使用joblib保存模型报错can't pickle weakref objects python 机器学习深度学习
2022-07-02 15:32

回答 1 已采纳你试试看下保存成pkl格式看看，感觉应该是格式的问题
预测播放量——应采取什么样的机器学习模型 python 大数据机器学习
2023-02-16 16:43

回答 3 已采纳选择随机森林模型来进行预测。因为你的数据集比较小，而且我们关注的是预测准确率和鲁棒性，随机森林可以有效地避免过拟合问题，并且相对于其他模型，它的计算复杂度也不是很高。
lightgbm模型保存为pmml文件 机器学习lgbm模型存为pmml文件通过java调用jar
2022-01-23 12:52

例如，一旦模型训练完成，可以使用以下代码保存模型： ```python import lightgbm as lgb # 假设我们已经训练好了一个名为lgb_model的模型 lgb_model.save_model('model.txt') ``` 然后，为了将LightGBM模型转换...
机器学习使用xgboost模型，报错：输入的数据有inf和nan？ python 机器学习深度学习
2023-01-29 20:23

回答 2 已采纳 XGBoost 默认是不能处理包含 inf 和 nan 的数据的，你需要先检测并处理掉数据中的无穷大或非数字值。如果数据确实包含过大的浮点数导致了此类问题，你可以考虑对数据进行对数处理来减小数值的范
在机器学习建立预测模型中，使用Bootstrap法，还需要划分训练集，验证集吗? 机器学习
2023-03-15 11:26

回答 2 已采纳这篇博客: 机器学习数据集（训练集、测试集）划分方法中的自助法(bootstrap) 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读: 以自助采样为基础，每次随机有放回的从
关于机器学习模型调参的正确步骤是怎样的？人工智能数据挖掘机器学习深度学习
2019-09-11 08:50

回答 2 已采纳 ``` # 1. # 交叉验证进行最优模型选择 from sklearn.model_selection import cross_val_score model = RandomFore
机器学习系列8 构建Web应用以使用机器学习模型
2022-05-08 17:47

在本教程中，我们将深入探讨如何将机器学习模型集成到Web应用程序中，让非技术人员也能通过用户友好的界面与预训练的模型互动。这在标题和描述中已经有所提及，我们将重点关注以下几个关键知识点： 1. **机器学习...
基于机器学习回归模型对广州二手房价格进行分析及模型评估项目源码
2022-04-06 16:29

3、基于机器学习回归模型对广州二手房价格进行分析及模型评估.ipynb是文章《基于机器学习回归模型对广州二手房价格进行分析及模型评估》中所用到的所有的代码，需要用jupyter notebook打开运行 4、配合博文《基于...
基于flask实现机器学习模型的api调用.zip
2024-02-15 16:23

在机器学习领域，将模型集成到API中可以方便地进行预测、数据验证以及与其他系统集成。首先，理解机器学习模型的API调用过程。API（应用程序编程接口）是软件之间交互的一种方式，它定义了客户端如何与服务器通信...
人工智能-机器学习-口碑预测-IJCAI-17 口碑商家客流量预测
2022-07-09 15:31

将商店中的地址、三级分类等名词映射成Id保存在该文件夹下。 statistics 原始数据处理后的数据，包括平滑后的数据，天气数据和天气统计。 test_train 存储线下线上train和test的特征以及标签文件。 weekABCD 线...
没有解决我的问题, 去提问

悬赏问题

¥20 MATLAB仿真三相桥式全控整流电路
¥15 EDA技术关于时序电路设计
¥15 百度文心一言流式返回sse失败
¥15 由于远程方已关闭传输流，身份验证失败
¥15 rt-detr，PCB，目标检测
¥15 有偿求指导实证代码。cfps清洗合并后，无论是构建平衡面板还是非平衡面板，都是只剩几百个样本量。求指导一下哪里出问题了，不要潦草回复
¥15 mutlinichenet
¥50 Qt5.14.2怎样使用qlistwidget存储指针类数据并更新？
¥15 STM32多路复用器ADC采样
¥20 Linux（ubuntu）操作相关问题

机器学习中怎么使用保存的模型进行预测

1条回答 默认 最新

悬赏问题

1条回答默认最新