自然语言处理中中文字匹配

从一句话中拆分成单个字，然后在从几个等级不同的字频表中匹配它是属于哪个等级的字频表（在未知的情况下默认是从最低等级的字频表开始匹配）.
求其实现过程原理！用Java实现。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2016-04-14 15:26
关注
首先你说的这个拆分，就是中文分词，你可以找一个分词库实现。然后你可以找词频表，google下有很多，如果你只是做学术的话。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

运用python语言编写下面问题 python
2021-11-11 19:55

回答 1 已采纳 songs = "你好我不知道" sum = 0 for i in range(len(songs)): if(songs[i]!=" "): sum += 1
比着会写代码，在工作中中算是合格吗前端
2022-04-20 09:08

回答 7 已采纳 1.首先说明一点：每个时期都会有适合的岗位供你选择，实习-初级-中级-高级-技术专家等，看你想达到什么高度，当然职位和薪资待遇是挂钩的2.接触代码初期都有能看懂，但是自己却做不出来的阶段，这个时期从个
怎么让respons data中的信息在柱状图中中显示出来 javascript vue.js
2022-09-17 11:06

回答 1 已采纳柱状图的data 应该是一个数组吧。你写个空数组。然后遍历数据，把对应的数据push进去就行了https://echarts.apache.org/examples/zh/editor.html
（初学者）用Python进行自然语言处理笔记一
2017-08-01 11:17

爱科研的徐博士的博客 Python编程链表list在Python中链表的表示为：[](这是一个空链表)，或者[‘A’,’B’].list中的元素是允许重复的！...list1.appen(1)#在链表中中追加内容 #list1:[1] list.append(2) #list1:[1,2] list1.append('A')
mat文件中的数据相减 matlab 开发语言
2023-03-11 15:25

回答 2 已采纳这段代码假设源文件目录 sourceDir 中包含多个以 data*.mat 命名的 MATLAB .mat 文件，其中星号 * 表示文件编号。例如，可能存在文件 data1.mat、data2.ma
程序中中语法无效，但我不知道哪里错了，帮帮我吧 python
2023-04-10 16:35

回答 3 已采纳改成这样试试 if m in list[1, 3, 5, 7, 9, 10, 12] and z == 31: print("年月日合法")
输入以下图片中的文字，写出一个程序，如操作结果所示。 c++
2020-05-15 17:22

回答 1 已采纳 ``` #include using namespace std; int main() { cout > ch; for (int i = 0; i = 0; i--
NLP系列(一) 解读Word2Vec原理与代码复现
2024-03-13 16:23

小酒馆燃着灯的博客本文概览：Word2Vec是语言模型中的一种，它是从大量文本预料中以无监督方式学习语义知识的模型，被广泛地应用于自然语言处理中。Word2Vec是用来生成词向量的工具，而词向量与语言模型有着密切的关系。因此，我们先来...
基于JDK的动态代理中中类加载器这个参数的作用是什么呢？ java
2023-03-09 15:37

回答 1 已采纳类加载器，主要负责动态创建类，并把它们加载到内存里
找出语句中中最长的单词
2017-03-07 15:34

回答 1 已采纳为了处理文章的最后一个单词，必须让这个单词后面还有字符（否则没有界符，最后一个要单独判断）而#符号是一个基本正常输入不会遇到的字符，很适合作为这个字符，设置在输入文本的最后。
环境变量配置后，为什么cmd命令中中能识别Java 却识别不了javac java
2021-09-10 14:53

回答 3 已采纳我试了一下，把jdk的bin文件夹下的javac.exe文件删除，就会出现这种状况，你检查一下是不是同样的原因
人工智能之产生式系统
2023-11-05 23:20

阿K不会写代码的博客判断每一个元素是否在事实数据库中存在，如果存在则继续遍历，不存在则判断事实库中中是否包含能够推出此事实的规则，如：21可根据规则1、2推导出如果有则继续遍历，没有，则推理失败。遍历所需事实列表结束且每个...
scanf输入的值如何能在循环中中保留到下一次给相同变量传递参数之前？ c语言
2022-02-26 20:14

回答 1 已采纳你应该先把输入的数据读入到一个数组中，如果输入数据的个数为奇数，你在数组最后补一个倒数第二个数，这样数组的元素个数始终是偶数。然后你的程序从数组里提取数据。
notes for llm-universe C5
2024-06-29 00:33

kriss-spy的博客以调用、发挥大模型为核心的大模型开发相较传统的 AI 开发更注重验证迭代因此，在使用 LLM 构建应用程序时，你可能会经历以下流程：首先，你会在一到三个样本的小样本中调整 Prompt ，尝试使其在这些样本上起效。...
【02】OpenCV数据载入、显示与保存
2023-03-26 13:58

花落指尖❀的博客数字图像处理就是通过一系列操作从矩阵数据中提取更深层次信息的过程，因此学习图像处理首先应该学会如何操作矩阵信息。OpenCV提供了Mat类用于存储矩阵数据。本篇内容将讲解Mat类的操作方式以及其支持的运算。 1.1...
Stephen Wolfram专访Judea Pearl：从贝叶斯网络到元胞自动机
2022-02-24 18:04

人工智能学家的博客来源：集智俱乐部编译：闫和东、徐培编辑：邓一雪导语2022年人工智能与数学国际研讨会（ISAIM 2022）恰逢著名计算机科学家、贝叶斯网络之父 Judea Pearl 85岁生日，...
迎来智能数据分析的新时代
2021-08-31 20:38

人工智能学家的博客来源：知乎(ID:熊墨淼)最近两星期（7月15日，7月22日)，《自然》杂志连续发表两篇DeepMind写的用人工智能的方法预测蛋白质三维结构的文章和NIH Director Franci...
面向社交媒体数据的抑郁检测与分析系统的设计与实现
2024-08-04 18:58

程序源码老李(专业接毕设)的博客他们通过分析用户在社交媒体上的言行举止、情绪表达以及社交互动等数据，借助自然语言处理、机器学习和情感分析等技术手段，试图识别用户是否存在抑郁情绪，甚至预测抑郁情绪发作的可能性。一些研究还尝试建立基于...
没有解决我的问题, 去提问

悬赏问题

¥30 STM32 INMP441无法读取数据
¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
¥15 用visualstudio2022创建vue项目后无法启动
¥15 x趋于0时tanx-sinx极限可以拆开算吗
¥500 把面具戴到人脸上，请大家贡献智慧
¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。
¥15 各位帮我看看如何写代码，打出来的图形要和如下图呈现的一样，急
¥30 c#打开word开启修订并实时显示批注
¥15 如何解决ldsc的这条报错/index error
¥15 VS2022+WDK驱动开发环境

自然语言处理中中文字匹配

1条回答 默认 最新

悬赏问题

1条回答默认最新