weixin_55043902 2021-05-10 22:02 采纳率: 50%
浏览 358
已采纳

向大佬请教,做LDA主题分析时,多个主题结果一样

如图中所示,我在做一些企业年报的分析,可能数据量比较小(100多篇)。分析的结果总是除了一个主题,其他主题结果一样。这是出什么问题了嘛?数据用Excel转csv保存的,一个报告放在一格中,去掉了换行符号。难道是每个句子放一格嘛?

  • 写回答

6条回答 默认 最新

  • CSDN专家-HGJ 2021-05-11 15:31
    关注

    1.数据上,读取时要设置header;2.在分词之前,要将各行数据进行处理。这样改:

    texts=pd.read_excel(r'data1.xlsx',header=None).astype(str)
    #通过jieba进行切词生成词袋
    
    text = [jp.cut(i) for i in texts.values.ravel()]
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?

悬赏问题

  • ¥15 彩灯控制电路,会的加我QQ1482956179
  • ¥200 相机拍直接转存到电脑上 立拍立穿无线局域网传
  • ¥15 (关键词-电路设计)
  • ¥15 如何解决MIPS计算是否溢出
  • ¥15 vue中我代理了iframe,iframe却走的是路由,没有显示该显示的网站,这个该如何处理
  • ¥15 操作系统相关算法中while();的含义
  • ¥15 CNVcaller安装后无法找到文件
  • ¥15 visual studio2022中文乱码无法解决
  • ¥15 关于华为5g模块mh5000-31接线问题
  • ¥15 keil L6007U报错