JAVA根据给定语料构建一个词云。

1.读取分词文件
2.统计每个词及词频
2.1 构建词及词频的存储结构WordFreq
2.2 构建元素类型为WordFreq的线性表
2.3 将分词文件中的词及词频存入线性表
2.3.1 如何将fileContent按照词切分
提示：利用String 类的split方法
2.3.2 如何统计词的频次
提示：
如果一个词word不在线性表中，则插入（word,1）；
否则在线性表中找到这个词，将它的频次加一；
这里涉及三个方法：insert，find，set
3. 构建停用词表（20分）
3.1 停用词，即对生成词云无用的词，比如“的”、“地”、“得”、“。”等
3.2 可以构建一个停用词文件，然后通过读取文件构建停用词表
3.3 将在停用词表中的词从词频统计线性表中删除
4.输出词频统计线性表信息到屏幕或者文件中（5分）
5.生成词云（10分）
5.1利用https://www.sohu.com/a/162276896_165070生成词云
5.2利用github中开源的代码生成词云（选作；加分项；）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
张彦峰ZYF Java领域优质创作者 2024-04-13 20:42
关注
给你一个大致的框架，然后你可以根据自己的需求和具体情况进行细化和实现。
1.读取分词文件：使用Java的文件读取功能读取分词文件。你可以使用FileReader和BufferedReader类来实现。
2.统计每个词及词频：
2.1 构建词及词频的存储结构WordFreq：创建一个WordFreq类，用于存储每个词及其频次。
2.2 构建元素类型为WordFreq的线性表：可以使用Java集合类中的ArrayList来实现。
2.3 将分词文件中的词及词频存入线性表：
2.3.1 使用String类的split方法将fileContent按照词切分。
2.3.2 统计词的频次：遍历切分后的词列表，对于每个词进行如下操作：
如果该词不在线性表中，则插入（word,1）；
否则在线性表中找到这个词，将它的频次加一。
3.构建停用词表：
3.1 创建一个停用词文件，列出对生成词云无用的词，如“的”、“地”、“得”、“。”等。
3.2 读取停用词文件，将停用词存入一个HashSet或者其他合适的数据结构中。
3.3 从词频统计线性表中删除停用词。
4.输出词频统计线性表信息：将词频统计线性表信息输出到屏幕或者文件中，可以使用System.out.println()来输出到屏幕，使用FileWriter来输出到文件中。
5.生成词云：
5.1 可以利用提供的链接，或者使用第三方库来生成词云。例如，可以使用Apache Commons Collections中的WordCloud类。
5.2 如果选择使用开源代码生成词云，可以在GitHub上搜索相关的Java库或者工具。

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

初学java懵了，这个异常是怎么产生的？
2022-06-23 09:01

一一哥Sun的博客大家先不要慌，且听壹哥来给大家分析一把。其实初学者遇到的绝大多数问题，都是因为粗心马虎导致的。而这个问题，也是如此。如果我们仔细观察报错的提示信息，就会发现这是因为命名不规范而导致的问题！怎么个意思？...
Java类的加载机制
2023-07-05 14:27

青春路上的小蜜蜂的博客到卸载出内存为止，它的整个生命周期包括：加载（Loading）、验证（Verification）、准备（Preparation）、解析（Resolution）、初始化（Intialization）、使用（Using）、卸载（Unloding）7个阶段。其中验证、准备...
JVM | 基于openJDK源码深度拆解Java虚拟机
2023-08-03 23:43

Kfaino的博客本篇完毕，我们来回顾下：在Java中，一切皆为对象。所以我们从对象出发，探索对象的内存结构。通过其设计的结构关联到JVM虚拟机的其它组件。一步步的解构这个JVM系统，最终掌握完整的JVM虚拟机。
Java 抽象类和接口
2021-12-02 18:00

只爱吃土豆的博客首先在了解抽象类和接口之前，我们需要知道什么是继承？什么是重写？而在知道抽象类和接口之后，我们就需要知道什么是多态...我先创建一个 Dog 类，Dog 类中有 name ，leg 属性字段，同时还有一个 cry 方法。 ...
米粽中文编程软件支持php,java,c++,js,html5等中文语法工具
2018-04-01 19:47

米粽中文编程软件支持php,java,c++,js,html5等中文语法工具，支持自己定语法开发工具，易语言开发的会有误报！
我在VScode学Java（Java的介绍，数据结构，运算符，流程控制语句）
2023-03-02 19:50

你会魔法吗✧(≖ ◡ ≖✿)的博客我在VScode学Java（Java的介绍，数据结构，运算符，流程控制语句）
五个经典的破坏双亲委派场景，Java被啪啪打脸
2022-03-01 14:16

编程一生的博客在《深入理解Java类加载机制，再也不用死记硬背了》这篇文章中提到，从JVM的角度看，加载的读取二进制流和初始化阶段，是开放了主导权给用户的。而剩下的所有部分都是JVM内部完成的。那为什么...
xpath java 用法_XPath JAVA用法总结及代码样例
2021-03-04 08:30

机智团队(风清扬)的博客一、基本概念介绍XPath 是一门在 XML 文档中查找信息的语言，可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。因此，对 XPath...
java 无理数_Java 程序设计：有理数类
2021-02-26 10:00

weixin_39531635的博客需求分析有理数是整数(正整数、0、负整数)和分数的统称，是整数和分数的集合。由于有理数的子集分别是整数和分数，因此对于类的属性的设计，需要提供满足这两种数的表达方式。...equals() 方法是每个类都可...
定语从句说课稿.doc
2021-04-29 14:01

定语从句说课稿
java HashSet 源码分析（深度讲解）
2023-03-20 18:27

Cyan_RA9的博客 java 集合篇章——HashSet源码解读。（非常详细）
定语从句基础练习一(关系代词).doc
2021-09-10 03:00

定语从句基础练习一(关系代词).doc
英语必修一unit定语从句PPT课件.pptx
2021-10-09 14:57

英语必修一unit定语从句PPT课件.pptx
java实现查询给定语句中特定字符的位置
2009-03-24 22:39

程序提供一个输入框，进行输入，然后查找其中特定字符的位置。其中包括英文字符的识别、位置的确定两个想法，绝对不是抄袭的，运行正常。花了三天时间搞完的，希望对初学者有所帮助。承诺：下载本资源免费给一套...
高一英语必修一unit4定语从句.ppt
2021-09-16 07:04

高一英语必修一unit4定语从句.ppt
Java模块化
2022-12-04 22:25

2档的博客传统的Java的类加载模型是双亲委派模型，如果一个类加载器收到了类加载的请求，它首先不会自己去尝试加载这个类，而是把这个请求委派给父类加载器去完成，每一个层次的类加载器都是如此，因此所有的加载请求最终都...
高三英语一轮之定语从句PPT课件.pptx
2021-10-10 06:09

高三英语一轮之定语从句PPT课件.pptx
每周一练定语从句[精选].doc
2021-08-19 15:58

每周一练定语从句[精选].doc
定语从句、被动语态专题复习.doc
2022-02-11 21:54

定语从句、被动语态专题复习
高考英语一轮复习定语从句综合复习PPT课件.pptx
2021-10-10 12:29

高考英语一轮复习定语从句综合复习PPT课件.pptx
没有解决我的问题, 去提问

悬赏问题

¥15 matlab求解平差
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制
¥20 usb设备兼容性问题
¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊
¥15 安装svn网络有问题怎么办
¥15 vue2登录调用后端接口如何实现
¥65 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？

JAVA根据给定语料构建一个词云。

1条回答 默认 最新

悬赏问题

1条回答默认最新