I_AM_YI 2021-07-01 23:30 采纳率: 100%
浏览 117
已采纳

怎么将biao.csv中的数据用train_test_split划分 第一次接触求帮助

import numpy as np
import pandas as pd

data=pd.read_csv('biao.csv',encoding='gbk')
#123条数据 8个特征 1个代号

#使用sklearn.cross_validation中的train_test_split模块用于数据分割
#from sklearn.cross_validation import train_test_split
from sklearn.model_selection import train_test_split

#随机采取25%用于测试数据,75%用于构建训练集合
X_train,X_test,y_train,y_test=train_test_split(data['进货总价税合计','销售总价税合计','是否违约_否','是否违约_是'],
data['信誉评级_A','信誉评级_B','信誉评级_C','信誉评级_D'],
test_size=0.25,
random_state = 33)

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import _logisticRegression
#标准化数据,保证每个维度的特征数据方差为1,均值为0,。使预测结果不为某些较大维度参数影响
ss = StandardScaler()
#创建对象
X_train = ss.fit_transform(X_train)
X_test = ss.fit_transform(X_test)

#初始化logisticRegression 逻辑回归
lr = logisticRegression()
#调用logisticRegression中的fit函数训练模型参数
lr.fit(X_train,y_train)

#使用训练好的模型lr对X_test进行预测,结果储存在lr_y_predict中
lr_y_predict =lr.predict(X_test)

  • 写回答

1条回答 默认 最新

  • python收藏家 2021-07-02 09:02
    关注

    代码里面不是已经使用train_test_split 划分了么?

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已采纳回答 7月14日

悬赏问题

  • ¥15 win11家庭中文版安装docker遇到Hyper-V启用失败解决办法整理
  • ¥15 gradio的web端页面格式不对的问题
  • ¥15 求大家看看Nonce如何配置
  • ¥15 Matlab怎么求解含参的二重积分?
  • ¥15 苹果手机突然连不上wifi了?
  • ¥15 cgictest.cgi文件无法访问
  • ¥20 删除和修改功能无法调用
  • ¥15 kafka topic 所有分副本数修改
  • ¥15 小程序中fit格式等运动数据文件怎样实现可视化?(包含心率信息))
  • ¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops?