就是我用数据集训练好了一个随机森林的模型。
然后我如何衡量这个训练好的模型,在新的数据集上运行的速度?
比方说我有个数据集quanbu.csv 包含特征数据和标签0,1。我用导入高斯朴素贝叶斯模型训练好了一个模型。然后我现在有个新的数据集 叫 新数据集.csv,里面特征数据不同,格式相同没给标签0,1。我如何不用重头训练而是导入训练好的机器学习模型,给新数据集.csv里面打上标签0,1。
(或者说就是想衡量抛去训练的时间,机器学习在测试集上运行的时间?)
就是我用数据集训练好了一个随机森林的模型。
然后我如何衡量这个训练好的模型,在新的数据集上运行的速度?
比方说我有个数据集quanbu.csv 包含特征数据和标签0,1。我用导入高斯朴素贝叶斯模型训练好了一个模型。然后我现在有个新的数据集 叫 新数据集.csv,里面特征数据不同,格式相同没给标签0,1。我如何不用重头训练而是导入训练好的机器学习模型,给新数据集.csv里面打上标签0,1。
(或者说就是想衡量抛去训练的时间,机器学习在测试集上运行的时间?)
直接加载模型然后对新数据集进行预测啊,结果就是0或者1,然后把结果按照之前训练的数据集格式写入一个新的csv,这就是相当于打上标签了,但是这个标签不一定是全部对的,除非你能保证你的模型推理结果一定是正确的。