我根据caret包的代码建立了一个预测模型
在最后用集成模型(stack.glm)对30万全新数据(preData)进行预测后
我得到了一个预测结果(predict_stack.glm)
但是由于这30万数据的真实结果是未知的
所以我不知道该如何评价预测的准确性
在模型中也没有看到关于这次预测的不确定性等指标
请问大家有方法调出我这次预测的任何评价指标吗
可以是预测值的95可信区间、不确定性等指标
模型构建的代码是根据https://www.machinelearningplus.com/machine-learning/caret-package/#92howtocombinethepredictionsofmultiplemodeltoformafinalprediction%E8%BF%99%E4%B8%AA%E7%BD%91%E7%AB%99%E6%AD%A5%E9%AA%A4%E6%9D%A5%E7%9A%84
我进行的是连续型变量的预测
我的集成模型组装了五种机器学习模型
下面是集成模型的建立和预测过程代码
trainControl <- trainControl(method="repeatedcv",
number=10,
repeats=3,
savePredictions='final')
algorithmList <- c('rf','earth','lasso','svmRadial','nnet')
models <- caretList(HighInfection ~ Prevalence+PC_n+TMP+GDP+NDVI+VAP+PREC+PPP+SF+Dist,
data=trainData,
trControl=trainControl,
methodList=algorithmList)
stackControl <- trainControl(method="repeatedcv",
number=10,
repeats=3)
stack.glm <- caretStack(models,
method="glm",
metric="RMSE",
trControl=stackControl)
predict_stack.glm <- predict(stack.glm, preData)