你好呀,汪同学! 2022-04-29 16:55 采纳率: 85%
浏览 248
已结题

pyspark报错,'DataFrame' object has no attribute '_jdf'

dataZscore:

img

dataZscore = (dataTransformed - dataTransformed.mean(axis=0)) /dataTransformed.std(axis=0)
dataZscore.columns = ['Z' + i for i in dataTransformed.columns]
dataZscore.head()

    ZL     ZR     ZF     ZM     ZC
0     1.435707     -0.944948     14.034016     26.761154     0.315041
1     1.307152     -0.911894     9.073213     13.126864     0.315041
2     1.328381     -0.889859     8.718869     12.653481     0.315041
3     0.658476     -0.416098     0.781585     12.540622     0.315041
4     0.386032     -0.922912     9.923636     13.898736     0.315041
#Kmeans
#导入工具包
import time
import pyspark.ml.clustering as clu
# 获取程序运行前时间
start = time.time()
#通过上图观察可知最好的簇数量为5
#初始化Kmeans模型
kmodel = clu.KMeans(k=5, initMode='k-means||', initSteps=10,maxIter=300, seed=0)
kmodel.fit(dataZscore)
# # 获取程序运行结束后时间
# end = time.time()
# print(f"使用K-means聚类算法的运行时间为:%.3fs" % (end-start))
# # 聚类算法的评价指标CH值的计算:
# score = calinski_harabaz_score(dataZscore, labels)  # 至越大表示聚类效果越好
# print("CH值:", score)

一直报错,没办法解决

img

'DataFrame' object has no attribute '_jdf'
  • 写回答

1条回答 默认 最新

    报告相同问题?

    相关推荐 更多相似问题

    问题事件

    • 系统已结题 5月7日
    • 已采纳回答 4月29日
    • 创建了问题 4月29日

    悬赏问题

    • ¥15 yolov5 双模态检测
    • ¥15 gradle项目报错
    • ¥60 有关C#的问题,基础牢固的来
    • ¥15 Python算法设计Seam carving--让图片比例随心缩放
    • ¥15 页面制作,HTML CSS
    • ¥15 通个批处理实现 win7和win10 修改或设置:显示操作系统列表时间为2秒
    • ¥20 报错:Unsupported class file major version 59
    • ¥15 用ASP代码实现跨站脚本攻击
    • ¥50 ABP中怎样接收vue上传的图片
    • ¥15 uniapp设置音频的倍速播放无效