pyspark.: Failed to execute user defined function 5C
   我用的语言是pyspark,用 rf 训练模型并预测,训练集和测试集维度一致,52个特征,提取特征的方式一样。
   训练集730个正样本,然后随机选取3500个负样本合并后再提取特征,训练模型没出问题,但无法输出预测结果,代码应该是没有问题的,不知道哪里忽略了,实在不知道出现的这个错误是什么原因。
        望指点,不胜感激!

最后几句代码如下:
prediction=model.transform(predict_data)
result=prediction.select("user_id","item_id","prediction")
result.createOrReplaceTempView("result")
spark.sql("drop table if exists result1")
spark.sql("create table result1 as SELECT user_id,item_id FROM result WHERE prediction>0 ") ### 程序没问题,现在错在这里
spark.sql("select count(1) from result1").show()

报错:图片说明

1个回答

sisteryaya
sisteryaya 检查过,维度没有问题
大约 2 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!