非树模型在建模过程中进行缺失值插补，在模型应用决策时遇到某些变量缺失，是否过模型？如何处理？

在建模过程中，某些算法对缺失值敏感，或者涉及到样本量大小时，会对缺失值进行插补。如果使用-9999对缺失值单独分箱、或者使用0值代替、或者使用平均数或者众数，都无可厚非。模型建立完成，进行决策时，如果遇到某些变量缺失，同样插入建模过程中插入的固定数值。可如果，建模过程中采用的是MICE多重插补、Datawig深度学习插补时，方法原理不同，插入的数据也不一样。能够在插补数据完成的情况下，完成模型开发。可在这类情况下，使用模型进行决策，当新客户有某些入模变量缺失时，模型如何决策？单一新客户进件的情况下，无法通过数据之间关联再使用插补法进行插补，这种情况下应该如何处理，是填0，还是不过模型？

import datawig

df_train, df_test = datawig.utils.random_split(train)

#Initialize a SimpleImputer model
imputer = datawig.SimpleImputer(
    input_columns=['1','2','3','4','5','6','7', 'target'], # column(s) containing information about the column we want to impute
    output_column= '0', # the column we'd like to impute values for
    output_path = 'imputer_model' # stores model data and metrics
    )

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2019-10-08 17:38
关注
https://blog.csdn.net/zxd1754771465/article/details/73550971

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用机器学习插补缺失值所得到的结果，该如何评价这个结果有多可靠？ python sklearn 机器学习
2022-09-21 23:03

回答 1 已采纳第一：使用缺失值和未缺失值数据集进行召回率，F1的比对，缺失值数据先需要统计缺少率以及填补策略。第二：交叉验证法。准确率，ROC,AUC,F1。
R语言缺失值处理实例分析_社会指标调查数据2018 r语言数据分析有问必答
2021-11-21 15:05

回答 1 已采纳你现在遇到什么问题呢，请具体说明啊
基于matlab的数字积分法圆弧插补图形仿真的程序 matlab 有问必答
2022-03-22 10:57

回答 5 已采纳最晚什么时候要
em模型补缺失值_如何填补缺失值？看SPSS提供的简单方法
2020-12-21 16:42

weixin_39936310的博客数据有缺失是常见的问题，如果是大数据集，在缺失比例较小(如10%以下)的情况下，可以考虑直接剔除，但如果本身是个小数据集，就不能轻易地做删除处理。建议采用缺失值填补技术来解决。在SPSS中，有两个菜单可以完成...
三维点3次B样条插补算法修改 matlab
2023-02-09 21:15

回答 1 已采纳你可以将二维点的代码适当地修改一下，就能得到三维点的代码： %三次B样条插值，给定插值点及两个边界条件，反算出控制点，由控制点得到分段曲线 %pointInput插值点，每一行的三个数字分别为X, Y
R语言，随机森林预测报错，怎么解决？ python r语言数据挖掘机器学习深度学习
2019-08-28 14:03

回答 1 已采纳问题已解决，是因为我之前已经给fraudscore.pre 赋值了，把历史清空重新跑一边就好了
c#做运动控制卡的线程循环有异常 c# visualstudio
2022-04-28 21:38

回答 4 已采纳用的谁家的板子，不同家板子的api不一样
em模型补缺失值_数据分析中缺失值的处理
2020-12-21 16:42

weixin_39756192的博客 缺失值简介造成数据缺失的原因有些信息暂时无法获取。例如小越现在在看哪个小姐姐有些信息是被遗漏的。可能是因为输入时认为不重要、忘记填写了或对数据理解错误而遗漏，也可能是由于数据采集设备的故障、存储介质的...
运动控制轨迹坐标提取求代劳 python
2021-12-16 00:52

回答 4 已采纳哈哈哈，为什么不是这样的?
评分模型的缺失值
2019-06-24 09:21

聋聋聋聋呀的博客构建评分模型过程中，建模属于流程性的过程，耗时不多，耗费大量精力的点在于缺失值的填充。缺失值填充的合理性直接决定了评分模型的成败。模型按照形式可划分为公式模型与算法模型，不同形式的模型对缺失值的宽容...
【视频】为什么要处理缺失数据？如何R语言中进行缺失值填充？
2022-09-15 23:03

拓端研究室的博客在任何现实世界的数据集中，通常都会有一些数据科学家和机器学习工程师必须处理的缺失数据，否则，它可能会导致开发数据时出现一些问题。因此，在这篇文章中，我将展示一些可用于处理数据驱动项目中丢失数据的技术，...
Python数学建模 缺失值与异常值处理
2022-07-10 23:30

_泥鳅的博客 缺失值，即存在特征或标签为空值的样本。包含空值的数据会使建模过程陷入混乱，导致不可靠输出。缺少过多的数据也将丢失大量有效信息，使数据模型难以把握数据规律。
python 线性回归回归 缺失值 忽略_样本缺失值处理，你真的操作对了吗？
2020-12-12 13:44

weixin_39991222的博客原标题：样本缺失值处理，你真的操作对了吗？我在数据清理与探索性分析中遇到的最常见问题之一就是处理缺失数据。首先我们需要明白的是，没有任何方法能够完美解决这个问题。不同问题有不同的数据插补方法——时间...
Python sklearn学习之缺失值插补
2019-08-02 18:08

洪城浪子的博客文章目录Python sklearn学习之缺失值插补1 单变量插补1.1 SimpleImputer类2 多变量插补2.1 IterativeImputer类3 标记缺失值 scikit-learn要求数据没有缺失值，如果出现了缺失值，则需要对数据集进行插补——从已有...
在R语言中进行缺失值填充：估算缺失值
2022-12-06 23:24

拓端研究室TRL的博客在大多数统计分析方法中，删除是用于处理缺失值的默认方法。但是，它会导致信息丢失。在本文中，我列出了5个R语言方法。通过链式方程进行的多元插补是R用户常用的。与单个插补（例如均值）相比，创建多个插补可解决...
python缺失值插补毕业论文_Python sklearn学习之缺失值插补
2020-12-10 02:01

weixin_39827589的博客 Python sklearn学习之缺失值插补文章目录Python sklearn学习之缺失值插补1 单变量插补1.1 SimpleImputer类2 多变量插补2.1 IterativeImputer类3 标记缺失值scikit-learn要求数据没有缺失值，如果出现了缺失值，则...
python处理缺失值的方法_常用的python缺失值处理方法有哪几种？
2020-12-04 10:23

weixin_39524636的博客 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。...(2)不对其进行处理在实际应用中，一些模型无法应对具有缺失值的数据，因此...
一文搞懂机器学习中的缺失值处理（超详细）
2021-04-26 13:05

yj8023xx的博客 缺失值处理数据缺失的原因 缺失值的产生的原因多种多样，主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失，比如数据存储的失败，存储器损坏，机械故障导致某段时间...
独家 | 在机器学习中利用统计插补来处理缺失值（附代码）
2020-06-15 17:08

数据派THU的博客作者：Jason Brownlee翻译：吴振东校对：冯羽本文约4500字，建议阅读10分钟本文以病马数据集为例，帮助你了解在机器学习领域如何利用统计策略来处理缺失值，对代码进行了较为详...
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

非树模型在建模过程中进行缺失值插补，在模型应用决策时遇到某些变量缺失，是否过模型？如何处理？

1条回答 默认 最新

悬赏问题

1条回答默认最新