森林冰火人水娃 2022-03-27 13:05 采纳率: 25%
浏览 109

sklearn怎么使用自己划分好的训练集和数据集?

逻辑回归实现鸾尾花三分类问题
要求必须使用已经划分好的数据集iris_train.data和iris_test.data,但是网上搜到的示例只有用train_test_split对整体数据集进行划分,怎么才能让X_train和X_test是自己的数据集呀?
谢谢了!

  • 写回答

2条回答 默认 最新

  • youcans_ 人工智能领域优质创作者 2022-03-27 13:26
    关注

    不需要用 train_test_split,直接把划分好的数据集作为 训练集进行训练就可以啊。

    官方文档的案例:

    >>> from sklearn.datasets import load_iris
    >>> from sklearn.linear_model import LogisticRegression
    >>> X, y = load_iris(return_X_y=True)
    >>> clf = LogisticRegression(random_state=0).fit(X, y)
    >>> clf.predict(X[:2, :])
    array([0, 0])
    >>> clf.predict_proba(X[:2, :])
    array([[9.8...e-01, 1.8...e-02, 1.4...e-08],
           [9.7...e-01, 2.8...e-02, ...e-08]])
    >>> clf.score(X, y)
    0.97...
    

    逻辑回归,算法的原理是不需要训练集、测试集,只是基于训练集进行训练,得到回归模型。
    划分训练集、测试集,只是用来测试、评估回归结果。

    评论

报告相同问题?

问题事件

  • 创建了问题 3月27日

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog