如图中所示,我在做一些企业年报的分析,可能数据量比较小(100多篇)。分析的结果总是除了一个主题,其他主题结果一样。这是出什么问题了嘛?数据用Excel转csv保存的,一个报告放在一格中,去掉了换行符号。难道是每个句子放一格嘛?
6条回答 默认 最新
- CSDN专家-HGJ 2021-05-11 15:31关注
1.数据上,读取时要设置header;2.在分词之前,要将各行数据进行处理。这样改:
texts=pd.read_excel(r'data1.xlsx',header=None).astype(str) #通过jieba进行切词生成词袋 text = [jp.cut(i) for i in texts.values.ravel()]
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 彩灯控制电路,会的加我QQ1482956179
- ¥200 相机拍直接转存到电脑上 立拍立穿无线局域网传
- ¥15 (关键词-电路设计)
- ¥15 如何解决MIPS计算是否溢出
- ¥15 vue中我代理了iframe,iframe却走的是路由,没有显示该显示的网站,这个该如何处理
- ¥15 操作系统相关算法中while();的含义
- ¥15 CNVcaller安装后无法找到文件
- ¥15 visual studio2022中文乱码无法解决
- ¥15 关于华为5g模块mh5000-31接线问题
- ¥15 keil L6007U报错