KMeans函数输出图像时为什么要输出中文的地方无法输出

'''python
#航空公司客户价值分析实战
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
datafile = "air_data.csv"   
kmodel = KMeans(n_clusters=6, n_jobs=6)
kmodel.fit(filter_zscore_data)
# 简单打印结果
r1 = pd.Series(kmodel.labels_).value_counts() #统计各个类别的数目
r2 = pd.DataFrame(kmodel.cluster_centers_) #找出聚类中心
# 所有簇中心坐标值中最大值和最小值
max = r2.values.max()
min = r2.values.min()
r = pd.concat([r2, r1], axis = 1) #横向连接（0是纵向），得到聚类中心对应的类别下的数目
r.columns = list(filter_zscore_data.columns) + [u'类别数目'] #重命名表头
 
# 绘图
fig=plt.figure(figsize=(10, 8))
ax = fig.add_subplot(111, polar=True)
center_num = r.values
feature = np.array(["入会时间", "飞行次数", "平均每公里票价", "总里程", "时间间隔差值", "入会时间"])
N =len(feature)
for i, v in enumerate(center_num):
    # 设置雷达图的角度，用于平分切开一个圆面
    angles=np.linspace(0, 2*np.pi, N, endpoint=False)
    # 为了使雷达图一圈封闭起来，需要下面的步骤
    center = np.concatenate((v[:-1],[v[0]]))
    angles=np.concatenate((angles,[angles[0]]))
    # 绘制折线图
    ax.plot(angles, center, 'o-', linewidth=2, label = "第%d簇人群,%d人"% (i+1,v[-1]))
    # 填充颜色
    ax.fill(angles, center, alpha=0.25)
    # 添加每个特征的标签
    ang=angles * 180/np.pi
    ax.set_thetagrids(ang[:-1], feature, fontsize=15)
    # 设置雷达图的范围
    ax.set_ylim(min-0.1, max+0.1)
    # 添加标题
    plt.title('客户群特征分析图', fontsize=20)
    # 添加网格线
    ax.grid(True)
    # 设置图例
    plt.legend(loc='upper right', bbox_to_anchor=(1.3,1.0),ncol=1,fancybox=True,shadow=True)
    
# 显示图形
plt.show()
#代码输出的时候出现了中文地方无法输出的问题，采用的编译软件是jupyter notebook

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

qq_57113568 2022-01-01 18:22

关注

import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
datafile = "air_data.csv"
data = pd.read_csv(datafile, encoding="utf-8")
print(data)
print(data.shape)
print(data.info())
print(data[0:5])
filter_data = data[[ "FFP_DATE", "LOAD_TIME", "FLIGHT_COUNT", "SUM_YR_1", "SUM_YR_2", "SEG_KM_SUM", "AVG_INTERVAL" , "MAX_INTERVAL", "avg_discount"]]
filter_data[0:5]  
data["LOAD_TIME"] = pd.to_datetime(data["LOAD_TIME"])
data["FFP_DATE"] = pd.to_datetime(data["FFP_DATE"])
data["入会时间"] = data["LOAD_TIME"] - data["FFP_DATE"]
data["平均每公里票价"] = (data["SUM_YR_1"] + data["SUM_YR_2"]) / data["SEG_KM_SUM"]
data["时间间隔差值"] = data["MAX_INTERVAL"] - data["AVG_INTERVAL"]
deal_data = data.rename(
    columns = {"FLIGHT_COUNT" : "飞行次数", "SEG_KM_SUM" : "总里程", "avg_discount" : "平均折扣率"},
    inplace = False
)
filter_data = deal_data[["入会时间", "飞行次数", "平均每公里票价", "总里程", "时间间隔差值", "平均折扣率"]]
print(filter_data[0:5])
filter_data['入会时间'] = filter_data['入会时间'].astype(np.int64)/(60*60*24*10**9)
print(filter_data[0:5])
print(filter_data.info())
filter_zscore_data = (filter_data - filter_data.mean(axis=0))/(filter_data.std(axis=0))
filter_zscore_data[0:5]
def distEclud(vecA, vecB):
    """
    计算两个向量的欧式距离的平方，并返回
    """
    return np.sum(np.power(vecA - vecB, 2))
 
def test_Kmeans_nclusters(data_train):
    """
    计算不同的k值时，SSE的大小变化
    """
    data_train = data_train.values
    nums=range(2,10)
    SSE = []
    for num in nums:
        sse = 0
        kmodel = KMeans(n_clusters=num, n_jobs=4)
        kmodel.fit(data_train)
        # 簇中心
        cluster_ceter_list = kmodel.cluster_centers_
        # 个样本属于的簇序号列表
        cluster_list = kmodel.labels_.tolist()
        for index in  range(len(data)):
            cluster_num = cluster_list[index]
            sse += distEclud(data_train[index, :], cluster_ceter_list[cluster_num])
        print("簇数是",num , "时； SSE是", sse)
        SSE.append(sse)
    return nums, SSE
 
nums, SSE = test_Kmeans_nclusters(filter_zscore_data)
#画图，通过观察SSE与k的取值尝试找出合适的k值
# 中文和负号的正常显示
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['font.size'] = 12.0
plt.rcParams['axes.unicode_minus'] = False
# 使用ggplot的绘图风格
plt.style.use('ggplot')
## 绘图观测SSE与簇个数的关系
fig=plt.figure(figsize=(10, 8))
ax=fig.add_subplot(1,1,1)
ax.plot(nums,SSE,marker="+")
ax.set_xlabel("n_clusters", fontsize=18)
ax.set_ylabel("SSE", fontsize=18)
fig.suptitle("KMeans", fontsize=20)
plt.show()
kmodel = KMeans(n_clusters=6, n_jobs=6)
kmodel.fit(filter_zscore_data)
# 简单打印结果
r1 = pd.Series(kmodel.labels_).value_counts() #统计各个类别的数目
r2 = pd.DataFrame(kmodel.cluster_centers_) #找出聚类中心
# 所有簇中心坐标值中最大值和最小值
max = r2.values.max()
min = r2.values.min()
r = pd.concat([r2, r1], axis = 1) #横向连接（0是纵向），得到聚类中心对应的类别下的数目
r.columns = list(filter_zscore_data.columns) + [u'类别数目'] #重命名表头
 
# 绘图
fig=plt.figure(figsize=(10, 8))
ax = fig.add_subplot(111, polar=True)
center_num = r.values
feature = np.array(["入会时间", "飞行次数", "平均每公里票价", "总里程", "时间间隔差值", "入会时间"])
N =len(feature)
for i, v in enumerate(center_num):
    # 设置雷达图的角度，用于平分切开一个圆面
    angles=np.linspace(0, 2*np.pi, N, endpoint=False)
    # 为了使雷达图一圈封闭起来，需要下面的步骤
    center = np.concatenate((v[:-1],[v[0]]))
    angles=np.concatenate((angles,[angles[0]]))
    # 绘制折线图
    ax.plot(angles, center, 'o-', linewidth=2, label = "第%d簇人群,%d人"% (i+1,v[-1]))
    # 填充颜色
    ax.fill(angles, center, alpha=0.25)
    # 添加每个特征的标签
    ang=angles * 180/np.pi
    ax.set_thetagrids(ang[:-1], feature, fontsize=15)
    # 设置雷达图的范围
    ax.set_ylim(min-0.1, max+0.1)
    # 添加标题
    plt.title('客户群特征分析图', fontsize=20)
    # 添加网格线
    ax.grid(True)
    # 设置图例
    plt.legend(loc='upper right', bbox_to_anchor=(1.3,1.0),ncol=1,fancybox=True,shadow=True)
    
# 显示图形
plt.show()

#全部代码如下，采用的是jupyter notebook，是航空公司客户价值分析的报告

报告相同问题？

关注问题

kmeans聚类实现python python 机器学习机器学习算法工程师-陶瑞
2021-03-07 23:56

回答 3 已采纳 matplotlib画出来呗。。。三维以内的都能画
python kmeans聚类后如何获取到分类的数据？ kmeans python 有问必答聚类
2022-01-16 22:16

回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
k-means聚类，写python代码出现报错，请问要如何解决 kmeans python 机器学习
2022-05-02 19:09

回答 2 已采纳你这不是个警告而已吗
python OpenCV 中 Kmeans 函数详解
2020-01-29 20:56

一只辛巴的博客 #图像二维像素转换为一维 #转换成3列 data = img.reshape((-1,3)) data = np.float32(data) #定义终止条件 (type,max_iter,epsilon) criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0) ...
kmeans 图像切割。 py-opencv，报错 kmeans opencv python
2022-02-22 14:23

回答 1 已采纳已解决for j in range(k): # np.mean(r,g,b,label)，属性和label都求个平均值 one_cluster = img_
如何将提取到的特征矩阵进行Kmeans的聚类操作 kmeans python 有问必答聚类
2022-04-07 11:20

回答 1 已采纳提供一个思路，多个矩阵你把他的维度reshape到一个一维的向量，这个一维度向量过一个函数得到某一个值，比如求和，比如求方差。这个函数需要你自己根据特征去设计。你得到每个矩阵的值，把所有值resha
sklearn Kmeans聚类三维列表 kmeans python sklearn
2023-04-13 09:13

回答 1 已采纳将三维列表转换为二维数组。具体来说，可以将三维列表中的每个二维数组展开成一行，并将所有行组成一个大的二维数组。然后将这个二维数组作为输入数据，调用sklearn库中的KMeans函数进行聚类: fro
利用Python-opencv进行图像分割：Kmeans的使用（含源码）
2021-05-19 08:39

叔均的博客二、如何使用Kmeans1.opencv中的Kmeans函数2.Kmeans代码示例总结前言本文是图像分割·专栏的第一篇。图像分割在整个图像处理过程中是很重要的一环，它大多数作为整个图像处理的预处理步骤，分割的目的主要是为了...
请问Python K-means算法求 SSE的值 python
2019-05-04 14:34

回答 1 已采纳理论上说,两种都是可以算作是SSE,因为都是在计算所有数据点到与其最近的cluster center的距离总和,越小说明选择的k越适合这个数据.两种方法的不同之处在于: cdist 计算的是eucl
使用KMeans拟合数据的时候出现警告You can avoid it by setting the environment variable OMP_NUM_THREADS=2 kmeans python 机器学习
2022-11-09 22:27

回答 1 已采纳 UserWarning: KMeans is known to have a memory leak on Windows with MKL, when there are less chunks t
python聚类错误 kmeans python
2022-12-08 16:58

回答 1 已采纳 https://blog.csdn.net/fuck11111100/article/details/114954399大概原因就是类型不匹配但是你代码里有太多东西没放出来，只能自己查原因了
kmeans算法详解和python代码实现
2022-11-28 14:40

花遇ty的博客无监督学习：指根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题的过程简单来说就是不知道分类的前提下，让计算机进行学习做事情其中有个重要的分类就是基于样本相似度的简单聚类方法，而kmeans算法就是...
Kmeans聚类算法应用问题，八维数据的分类 kmeans python 有问必答聚类
2021-11-08 09:09

回答 1 已采纳分类： km = KMeans(n_clusters=4) km.fit_predict(data) 分完类之后得到了聚类中心，也就是km.cluster_centers_，你可以print出来：
Python之----KMeans算法处理图像与MiniBatchKMeans（小批量处理算法）处理图像
2021-12-05 13:21

咸鱼_翻身的博客 1、KMeans算法 from PIL import Image import matplotlib.pyplot as plt import numpy as np from sklearn.cluster import KMeans, MiniBatchKMeans import datetime if __name__ == "__main__": A = Image.open(...
全面解析Kmeans聚类算法（Python）
2022-04-21 10:34

我爱Python数据挖掘的博客我们并不清楚某一类是什么（通常无标签信息），需要实现的目标只是把相似的样本聚到一起，即只是利用样本数据本身的分布规律。在本文中，我将详细介绍聚类算法，喜欢本文记得收藏、关注、点赞。【注】完整版代码、...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月1日

悬赏问题

¥15 计算二重积分∫∫e^(x+y)dxdy，其中0≤x≤1,0≤y≤1，试分别用复合辛普森公式（取n=4）以及高斯求积公式（取n=4）计算积分给出matlab程序
¥15 opencv 无法读取视频
¥15 用matlab 实现通信仿真
¥15 按键修改电子时钟，C51单片机
¥60 Java中实现如何实现张量类，并用于图像处理(不运用其他科学计算库和图像处理库）)
¥20 5037端口被adb自己占了
¥15 python：excel数据写入多个对应word文档
¥60 全一数分解素因子和素数循环节位数
¥15 ffmpeg如何安装到虚拟环境
¥188 寻找能做王者评分提取的

KMeans函数输出图像时为什么要输出中文的地方无法输出

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新