测试小冥 2024-03-14 14:57 采纳率: 0%
浏览 7
已结题

有回收余额红包的吗速来

出CSDN余额红包,有五级账号速度来,互利共赢一起发财,冲啊,速度

  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2024-03-14 16:26
    关注

    【相关推荐】



    • 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7399682
    • 你也可以参考下这篇文章:如何爬取CSDN全站综合热榜标题,顺便统计关键词词频 | 爬虫案例
    • 您还可以看一下 CSDN讲师老师的CSDN在线峰会系列—阿里云核心技术竞争力第二期课程中的 蔡俊杰:《云计算的终极秘密 - 智能的弹性》小节, 巩固相关知识点
    • 除此之外, 这篇博客: 致CSDN读者的一些话:感恩这十年的陪伴,不负遇见,短暂消失中的 5.层次聚类主题树状图 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

      层次聚类绘制的树状图,也是文本挖掘领域常用的技术,它会将各个领域相关的主题以树状的形式进行显示,这里输出结果如下图所示:

      在这里插入图片描述

      注意,这里作者可以通过设置过滤来显示树状图显示的主题词数量,并进行相关的对比实验,找到最优结果。

      # -*- coding: utf-8 -*-
      import os
      import codecs
      from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer
      from sklearn.manifold import TSNE
      from sklearn.cluster import KMeans
      import matplotlib.pyplot as plt
      import numpy as np
      import pandas as pd
      import jieba
      from sklearn import metrics
      from sklearn.metrics import silhouette_score
      from array import array
      from numpy import *
      from pylab import mpl
      from sklearn.metrics.pairwise import cosine_similarity
      import matplotlib.pyplot as plt
      import matplotlib as mpl
      from scipy.cluster.hierarchy import ward, dendrogram
      
      #---------------------------------------加载语料-------------------------------------
      text = open('06-data-fenci.txt').read()
      print(text)
      list1=text.split("\n")
      print(list1)
      print(list1[0])
      print(list1[1])
      mytext_list=list1
      
      #控制显示数量
      count_vec = CountVectorizer(min_df=20, max_df=1000)  #最大值忽略
      xx1 = count_vec.fit_transform(list1).toarray()
      word=count_vec.get_feature_names() 
      print("word feature length: {}".format(len(word)))
      print(word)
      print(xx1)
      print(type(xx1))
      print(xx1.shape)
      print(xx1[0])
      
      #---------------------------------------层次聚类-------------------------------------
      titles = word
      #dist = cosine_similarity(xx1)
      
      mpl.rcParams['font.sans-serif'] = ['SimHei']
      
      df = pd.DataFrame(xx1)
      print(df.corr())
      print(df.corr('spearman'))
      print(df.corr('kendall'))
      dist = df.corr()
      print (dist)
      print(type(dist))
      print(dist.shape)
      
      #define the linkage_matrix using ward clustering pre-computed distances
      linkage_matrix = ward(dist) 
      fig, ax = plt.subplots(figsize=(8, 12)) # set size
      ax = dendrogram(linkage_matrix, orientation="right",
                      p=20, labels=titles, leaf_font_size=12
                      ) #leaf_rotation=90., leaf_font_size=12.
      #show plot with tight layout
      plt.tight_layout() 
      #save figure as ward_clusters
      plt.savefig('07-KH.png', dpi=200)
      plt.show()
      


    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 10月17日
  • 创建了问题 3月14日

悬赏问题

  • ¥100 yahoo finance api 2024年更改访问限制後的 java串接方法
  • ¥15 节日彩灯电路设计电路图
  • ¥15 esp32cam串口图传
  • ¥15 C# 用partial定义部分类无法快速预览代码
  • ¥15 fastreport 代码无法设置最后一页横线不显示
  • ¥15 stm32u535芯片usb hid custom类接收数据有问题
  • ¥15 ue5.3 pico打包失败 求帮助
  • ¥15 请教,这是用chatgpt写的CAD LISPD脚本,需求是画一个由双直线组成的矩形
  • ¥50 微信小程序 成功包奶茶啊
  • ¥15 计算机博弈的六子棋代码