如图中所示,我在做一些企业年报的分析,可能数据量比较小(100多篇)。分析的结果总是除了一个主题,其他主题结果一样。这是出什么问题了嘛?数据用Excel转csv保存的,一个报告放在一格中,去掉了换行符号。难道是每个句子放一格嘛?
6条回答 默认 最新
- CSDN专家-HGJ 2021-05-11 15:31关注
1.数据上,读取时要设置header;2.在分词之前,要将各行数据进行处理。这样改:
texts=pd.read_excel(r'data1.xlsx',header=None).astype(str) #通过jieba进行切词生成词袋 text = [jp.cut(i) for i in texts.values.ravel()]
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥30 这是哪个作者做的宝宝起名网站
- ¥60 版本过低apk如何修改可以兼容新的安卓系统
- ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
- ¥50 有数据,怎么建立模型求影响全要素生产率的因素
- ¥50 有数据,怎么用matlab求全要素生产率
- ¥15 TI的insta-spin例程
- ¥15 完成下列问题完成下列问题
- ¥15 C#算法问题, 不知道怎么处理这个数据的转换
- ¥15 YoloV5 第三方库的版本对照问题
- ¥15 请完成下列相关问题!