weixin_43640273
2019-10-21 18:21 阅读 607

JAVA根据给定语料构建一个词云。

1.读取分词文件
2.统计每个词及词频
2.1 构建词及词频的存储结构WordFreq
2.2 构建元素类型为WordFreq的线性表
2.3 将分词文件中的词及词频存入线性表
2.3.1 如何将fileContent按照词切分
提示:利用String 类的split方法
2.3.2 如何统计词的频次
提示:
如果一个词word不在线性表中,则插入(word,1);
  否则在线性表中找到这个词,将它的频次加一;
  这里涉及三个方法:insert,find,set
3. 构建停用词表(20分)
3.1 停用词,即对生成词云无用的词,比如“的”、“地”、“得”、“。”等
3.2 可以构建一个停用词文件,然后通过读取文件构建停用词表
3.3 将在停用词表中的词从词频统计线性表中删除
4.输出词频统计线性表信息到屏幕或者文件中(5分)
5.生成词云(10分)
5.1利用https://www.sohu.com/a/162276896_165070生成词云
5.2利用github中开源的代码生成词云(选作;加分项;)

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享