JAVA根据给定语料构建一个词云。

1.读取分词文件
2.统计每个词及词频
2.1 构建词及词频的存储结构WordFreq
2.2 构建元素类型为WordFreq的线性表
2.3 将分词文件中的词及词频存入线性表
2.3.1 如何将fileContent按照词切分
提示：利用String 类的split方法
2.3.2 如何统计词的频次
提示：
如果一个词word不在线性表中，则插入（word,1）；
否则在线性表中找到这个词，将它的频次加一；
这里涉及三个方法：insert，find，set
3. 构建停用词表（20分）
3.1 停用词，即对生成词云无用的词，比如“的”、“地”、“得”、“。”等
3.2 可以构建一个停用词文件，然后通过读取文件构建停用词表
3.3 将在停用词表中的词从词频统计线性表中删除
4.输出词频统计线性表信息到屏幕或者文件中（5分）
5.生成词云（10分）
5.1利用https://www.sohu.com/a/162276896_165070生成词云
5.2利用github中开源的代码生成词云（选作；加分项；）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
张彦峰ZYF Java领域优质创作者 2024-04-13 20:42
关注
给你一个大致的框架，然后你可以根据自己的需求和具体情况进行细化和实现。
1.读取分词文件：使用Java的文件读取功能读取分词文件。你可以使用FileReader和BufferedReader类来实现。
2.统计每个词及词频：
2.1 构建词及词频的存储结构WordFreq：创建一个WordFreq类，用于存储每个词及其频次。
2.2 构建元素类型为WordFreq的线性表：可以使用Java集合类中的ArrayList来实现。
2.3 将分词文件中的词及词频存入线性表：
2.3.1 使用String类的split方法将fileContent按照词切分。
2.3.2 统计词的频次：遍历切分后的词列表，对于每个词进行如下操作：
如果该词不在线性表中，则插入（word,1）；
否则在线性表中找到这个词，将它的频次加一。
3.构建停用词表：
3.1 创建一个停用词文件，列出对生成词云无用的词，如“的”、“地”、“得”、“。”等。
3.2 读取停用词文件，将停用词存入一个HashSet或者其他合适的数据结构中。
3.3 从词频统计线性表中删除停用词。
4.输出词频统计线性表信息：将词频统计线性表信息输出到屏幕或者文件中，可以使用System.out.println()来输出到屏幕，使用FileWriter来输出到文件中。
5.生成词云：
5.1 可以利用提供的链接，或者使用第三方库来生成词云。例如，可以使用Apache Commons Collections中的WordCloud类。
5.2 如果选择使用开源代码生成词云，可以在GitHub上搜索相关的Java库或者工具。

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

初学java懵了，这个异常是怎么产生的？
2022-06-23 09:01

一一哥Sun的博客大家先不要慌，且听壹哥来给大家分析一把。其实初学者遇到的绝大多数问题，都是因为粗心马虎导致的。而这个问题，也是如此。如果我们仔细观察报错的提示信息，就会发现这是因为命名不规范而导致的问题！怎么个意思？...
Java类的加载机制
2023-07-05 14:27

青春路上的小蜜蜂的博客到卸载出内存为止，它的整个生命周期包括：加载（Loading）、验证（Verification）、准备（Preparation）、解析（Resolution）、初始化（Intialization）、使用（Using）、卸载（Unloding）7个阶段。其中验证、准备...
JVM | 基于openJDK源码深度拆解Java虚拟机
2023-08-03 23:43

Kfaino的博客本篇完毕，我们来回顾下：在Java中，一切皆为对象。所以我们从对象出发，探索对象的内存结构。通过其设计的结构关联到JVM虚拟机的其它组件。一步步的解构这个JVM系统，最终掌握完整的JVM虚拟机。
Java 抽象类和接口
2021-12-02 18:00

只爱吃土豆的博客首先在了解抽象类和接口之前，我们需要知道什么是继承？什么是重写？而在知道抽象类和接口之后，我们就需要知道什么是多态...我先创建一个 Dog 类，Dog 类中有 name ，leg 属性字段，同时还有一个 cry 方法。 ...
米粽中文编程软件支持php,java,c++,js,html5等中文语法工具
2018-04-01 19:47

米粽中文编程软件支持php,java,c++,js,html5等中文语法工具，支持自己定语法开发工具，易语言开发的会有误报！
我在VScode学Java（Java的介绍，数据结构，运算符，流程控制语句）
2023-03-02 19:50

你会魔法吗✧(≖ ◡ ≖✿)的博客我在VScode学Java（Java的介绍，数据结构，运算符，流程控制语句）
五个经典的破坏双亲委派场景，Java被啪啪打脸
2022-03-01 14:16

编程一生的博客在《深入理解Java类加载机制，再也不用死记硬背了》这篇文章中提到，从JVM的角度看，加载的读取二进制流和初始化阶段，是开放了主导权给用户的。而剩下的所有部分都是JVM内部完成的。那为什么...
xpath java 用法_XPath JAVA用法总结及代码样例
2021-03-04 08:30

机智团队(风清扬)的博客一、基本概念介绍XPath 是一门在 XML 文档中查找信息的语言，可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。因此，对 XPath...
java 无理数_Java 程序设计：有理数类
2021-02-26 10:00

weixin_39531635的博客需求分析有理数是整数(正整数、0、负整数)和分数的统称，是整数和分数的集合。由于有理数的子集分别是整数和分数，因此对于类的属性的设计，需要提供满足这两种数的表达方式。...equals() 方法是每个类都可...
定语从句说课稿.doc
2021-04-29 14:01

定语从句说课稿
java HashSet 源码分析（深度讲解）
2023-03-20 18:27

Cyan_RA9的博客 java 集合篇章——HashSet源码解读。（非常详细）
定语从句基础练习一(关系代词).doc
2021-09-10 03:00

定语从句基础练习一(关系代词).doc
英语必修一unit定语从句PPT课件.pptx
2021-10-09 14:57

英语必修一unit定语从句PPT课件.pptx
java实现查询给定语句中特定字符的位置
2009-03-24 22:39

程序提供一个输入框，进行输入，然后查找其中特定字符的位置。其中包括英文字符的识别、位置的确定两个想法，绝对不是抄袭的，运行正常。花了三天时间搞完的，希望对初学者有所帮助。承诺：下载本资源免费给一套...
高一英语必修一unit4定语从句.ppt
2021-09-16 07:04

高一英语必修一unit4定语从句.ppt
Java模块化
2022-12-04 22:25

2档的博客传统的Java的类加载模型是双亲委派模型，如果一个类加载器收到了类加载的请求，它首先不会自己去尝试加载这个类，而是把这个请求委派给父类加载器去完成，每一个层次的类加载器都是如此，因此所有的加载请求最终都...
数据分析、JAVA、数据库粗略总结
2021-09-01 21:46

帅过库里的博客暑假中对于JAVA、数据库、数据分析都有了一定的学习，但是都学的不深，都算是沾了一点皮毛，下面我就分别对于这几个的说说我的了解。暑假学习总结JAVA数据库数据分析 JAVA 一、基础知识： 1、JVM、JRE和JDK的区别：...
高三英语一轮之定语从句PPT课件.pptx
2021-10-10 06:09

高三英语一轮之定语从句PPT课件.pptx
每周一练定语从句[精选].doc
2021-08-19 15:58

每周一练定语从句[精选].doc
定语从句、被动语态专题复习.doc
2022-02-11 21:54

定语从句、被动语态专题复习
没有解决我的问题, 去提问

悬赏问题

¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3

JAVA根据给定语料构建一个词云。

1条回答 默认 最新

悬赏问题

1条回答默认最新