- 收集一些数据保存在.txt文件中编程实现从.txt文件中读出数据。
- 根据(1)读出的数据,自定某类统计对象(可以是人物、地点、专有名词等等),统计该类中关键词出现的次数,显示出现次数前8的关键词名称及其具体次数。
- 基于(2)统计的词频结果,绘制词云图,词云图的背景图片、图片大小等属性自定。
- 基于(2)统计的词频结果,绘制图形展现各关键词出现次数的差异,可以是柱状图、折线图等,图形样式自定。并对图形进行修饰,即标注出中文状态下的横坐标、纵坐标、图形标题等。
- 基于(2)统计的词频结果,创建DataFrame对象(即二维关系表格),在此基础上依据关键词出现的次数,进行降序排列。对排序之后的结果,切片取出排在第一位、第三位、第五位、第七位的关键词及其出现的次数。
将(5)中切片得到的结果保存在一个excel文件中,文件名自拟。