ivan_ou 2017-12-28 03:21 采纳率: 33.3%
浏览 3086
已结题

scikit-learn模型继续训练的问题

我用sklearn,已经训练好了模型,并且用joblib持久化了。然后重新加载出来
model = joblib.load('d:/model/SVMmodel.pkl')
这个时候,如果我想把model再继续让它在之前的基础上学习,该如何处理?

  • 写回答

3条回答 默认 最新

  • kaoshuiwan 2018-01-03 08:06
    关注

    直接再train这个model不行么,你又没初始化,模型参数还是之前的参数,继续训练就是在原来的基础上训练吧。

    评论
  • 风 先生 2018-05-22 06:29
    关注

    貌似大部分的module都是直接提供fit函数的,fit会重新对模型进行初始化;
    但有一部分的module提供了partial_fit函数,在第一次训练时,fit和partial_fit训练模型的原理其实本质上是一样的。
    但是对于partial_fit的模型来说,当我们有了新数据,我们可以用新的数据在旧的模型基础上训练、更新模型,而不必重新训练。

    评论
  • qq_36518991 2017-12-28 07:43
    关注

    在python的世界中,科学计算和机器学习的标配就是:sklearn+numpy+pandas+scipy+matplotlib,其中numpy和pandas的作用大同小异,scipy主要是仿真计算中包含了很多有用的数学函数,matplotlib模块主要是做数据的可视化工作,比如在机器学习中经典的分类和聚类问题中,通过数据的可视化手段可以实现直观的观察到样本数据的分类或者聚类情况,从而调整阈值或者其他参数信息,为模型的训练和优化提供了很好的调整依据。sklearn模块的话相信很多人都使用过,这个模块里面几乎囊括了所有的常见的机器学习方法,特征工程方法,可以说是一个入手机器学习实践的不二选择,真的很强大,虽然相对于深度学习的一些框架诸如:TensorFlow、Theano、Kreas等尚存在一定的差距,但是就机器学习的算法本身而言已经足够出色了。

    在sklearn官网可以找到所有你需要的介绍

    sklearn内置了几乎所有常用的机器学习算法,但是这并不意味着这个很容易掌握和使用,每一个模型或者函数都有很多参数需要设置,想要熟练掌握的话,必然离不开官方文档的帮助,遇上问题要先看文档

    看不懂或者不喜欢英文没关系这里是中文手册

    sklearn的安装可以参考这里

    写这篇博文的目的不在于仔细去讲解sklearn的使用方法也不是说特征工程的相关方法,而是我在学习的时候发现很多最开始以为是机器学习的问题的时候可能做了一段时间后却发现是数据挖掘的问题,让人突然觉着本末倒置的感觉,都说工欲善其事必先利其器,这是真的,现在的很多问题都不是单纯的特征工程+机器学习的解决思路,更多的是一个数据挖掘的问题,但是我自己也是一个门外汉,并不是很懂这些,在我看来:
    

    一个数据挖掘的整体流程,主要包括

    如何定义好自己的问题
    数据的分析、处理
    机器学习模型的训练和测试
    模型的自学习、优化、更新

    而在实现时,通俗的讲为:

    对数据进行各种预处理(抽样,去噪等)
    特征抽取与量化
    训练模型
    利用模型对预测数据进行预测
    根据预测结果计算精度以及其他的衡量指标包括:准确率、召回率、F值、ROC曲线等

    之前我的一篇博文python实现完整的特征工程,实践论文中的分类模型和方法用于恶意页面的分类与识别已经讲到了我做过的一些事情,不过主要是集中在了特征工程这里,但是没有给出来sklearn之后具体的模型使用方法,这里我在网上找到了一个可以参考的使用方法,很简单,但是解决了需要解决的问题。
    
    相信这是一个很好的工具,不过真正使用好离不开文档,强烈建议无论遇上什么问题都要多看勤看文档,相关的参考链接都在上面给出来了。
    
    评论

报告相同问题?

悬赏问题

  • ¥40 基于51单片机实现球赛计分器功能
  • ¥15 关于#ubuntu#的问题:把PPT上的实验做一下,只需要实验截图就行(语言-r语言)
  • ¥15 cs2游戏画面卡住,应用程序sid与指挥者sid不匹配
  • ¥15 实验七:Pandas要有实验截图和代码
  • ¥15 TypeError: Make sure that the iterable only contains strings.
  • ¥35 电脑放图书馆,这是被黑了吗
  • ¥15 等高线中数据取消科学计数法
  • ¥15 Qt播放10路ffmpeg 视频流
  • ¥15 如何利用闲置机械硬盘变现
  • ¥15 信号处理中的凸优化问题