蘑菇仙人 2023-03-17 22:23 采纳率: 96%
浏览 128
已结题

训练数据中的变量在newdata中缺失

输入exp_rf <- explain(model1rf1K10K, data = deridata1_x, y = as.numeric(deridata1[,28])-1)
library("shapper")
ive_rf <- shap(exp_rf, new_observation = validdata1_x),提示Error: RuntimeError: variables in the training data missing in newdata。但是validdata1_x和deridata1_x的变量名称是完全相同的。求报错原因和解决办法。

  • 写回答

3条回答 默认 最新

  • MarkHan_ 2023-03-17 22:51
    关注

    该回答引用GPTᴼᴾᴱᴺᴬᴵ
    这个错误通常发生在在new_observation中的变量名称与训练数据中的变量名称不完全匹配。有可能是由于一些变量名拼写错误或者数据类型不匹配等原因导致的。在检查变量名之前,可以尝试检查一下数据类型是否匹配。在这个例子中,可以使用以下命令检查两个数据框的列的数据类型是否匹配:

    str(deridata1_x)
    str(validdata1_x)
    
    
    

    如果两个数据框中的数据类型不匹配,需要将它们转换为相同的数据类型。例如,如果其中一个数据框中的变量是字符型而另一个数据框中的变量是数值型,则需要将字符型变量转换为数值型变量。

    如果两个数据框中的数据类型匹配,则需要检查变量名是否匹配。您可以使用以下命令比较两个数据框的变量名:

    setdiff(names(deridata1_x), names(validdata1_x))
    setdiff(names(validdata1_x), names(deridata1_x))
    
    
    

    这些命令将显示在一个数据框中但在另一个数据框中缺失的变量名称。检查变量名并确保它们在两个数据框中相同,这可能有助于解决这个问题。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 4月17日
  • 已采纳回答 4月9日
  • 创建了问题 3月17日

悬赏问题

  • ¥15 javaweb登陆的网页为什么不能正确连接查询数据库
  • ¥15 数学建模数学建模需要
  • ¥15 已知许多点位,想通过高斯分布来随机选择固定数量的点位怎么改
  • ¥20 nao机器人语音识别问题
  • ¥15 怎么生成确定数目的泊松点过程
  • ¥15 layui数据表格多次重载的数据覆盖问题
  • ¥15 python点云生成mesh精度不够怎么办
  • ¥15 QT C++ 鼠标键盘通信
  • ¥15 改进Yolov8时添加的注意力模块在task.py里检测不到
  • ¥50 高维数据处理方法求指导