weixin_55043902 2021-05-10 22:02 采纳率: 50%
浏览 365
已采纳

向大佬请教,做LDA主题分析时,多个主题结果一样

如图中所示,我在做一些企业年报的分析,可能数据量比较小(100多篇)。分析的结果总是除了一个主题,其他主题结果一样。这是出什么问题了嘛?数据用Excel转csv保存的,一个报告放在一格中,去掉了换行符号。难道是每个句子放一格嘛?

  • 写回答

6条回答 默认 最新

  • CSDN专家-HGJ 2021-05-11 15:31
    关注

    1.数据上,读取时要设置header;2.在分词之前,要将各行数据进行处理。这样改:

    texts=pd.read_excel(r'data1.xlsx',header=None).astype(str)
    #通过jieba进行切词生成词袋
    
    text = [jp.cut(i) for i in texts.values.ravel()]
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!