2 yzc 1992 yzc_1992 于 2014.11.23 17:42 提问

如何用Java实现中文无词典分词,类似于fudannlp分词系统,能不能给出代码?

如何用Java实现中文无词典分词,类似于fudannlp分词系统,能不能给出代码?

1个回答

helihongzhizhuo
helihongzhizhuo   Rxr 2014.11.24 10:44
yzc_1992
yzc_1992 能不能给出详细代码
3 年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
FudanNLP 复旦分词系统 小试一把
今天机缘巧合,碰到了fudannlp,就决定尝试一小把。。。发现还是蛮好用的。     首先下载需要的东西,一个.gz 文件,两个jar包。分别是:seg.c7.110918.gz,fudannlp-1.05.jar和trove-2.1.0.jar。          以下是小弟编写的测试程序:       public static void main(String[] args) t
中文分词系统之-导入文本文件类词库建立哈希表索引-JAVA源码
/*/*分词系统的词典导入的接口类,主要实现文本文件中词典的导入,及创建哈希表。且实现初步的哈希表关键字查询*输入参数:Iterator other/int max *输出数据:*author 张顺明*email  mingzhingjien@hotmail.com**/ packag
中科院分词系统(NLPIR)JAVA简易教程
这篇文档内容主要从官方文档中获取而来,对API进行了翻译,并依据个人使用经验进行了一些补充,鉴于能力有限、水平较低,文档中肯定存在有很多不足之处,还请见谅。 下载地址:http://ictclas.nlpir.org/downloads,下载最新的NLPIR/ICTCLAS分词系统下载包 授权文件下载地址:https://github.com/NLPIR-team/NLPIR/tree
NLPIR中文分词系统之Java接口的使用
昨天接到经理的安排,让我做项目中的分词模块并介绍说可以使用中科院的ICTCLAS(最新版本改名为NLPIR)中文分词系统。于是自己花了一下午的时间来了解它,并试着搭建测试环境;这方面的资料比较少,幸好使用起来并不复杂,借助着搜索引擎的帮助,终于在官方文档以及网络博客的帮助下弄明白了其Java接口的使用方法。 参考资源: http://blog.csdn.net/hellonlp/art
fudanNLP(fnlp)添加自定义字典
fnlp目前找到的接口方便的开源的NLP开源工具 StanfordNLP Hanlp FudanNLP NLTK LTP 由于StanfordNLP中文包配置较困难,使用fnlp做分词加语义 考虑语义依存时,算法几乎都如出一辙的HMM,所以暂且认为模型参数问题可以用scale的数据量弥补。fnlp这是一段具有分词,实体识别,语义依存功能的代码import org.fnlp.nlp.cn
实现分词功能和使用fudanNLP
中文分词,研究fudanNLP,使用字典或者基于统计
基于python的中文分词的实现及应用
基于python的中文分词的实现及应用 刘新亮 严姗姗 (北京工商大学计算机学院,100037)       摘  要  中文分词的实现及应用属于自然语言处理范畴,完成的是中文分词在Python语言环境下的实现,以及利用这个实现的一个应用程序接口和一个中文文本处理的应用。设计共分为五个部分,分别是:分词模块、包装模块、应用程序接口、Nonsense模块,这个项目是为了下一步开放源代码的中文
自然语言处理(NLP)常用开源工具总结----不定期更新
学习自然语言这一段时间以来接触和听说了好多开源的自然语言处理工具,在这里做一下汇总方便自己以后学习,其中有自己使用过的也有了解不是很多的,对于不甚了解的工具以后学习熟悉了会做更新的。 1.IKAnalyzer IK Analyzer是一个开源的,基于Java语言开发的轻量级的中文分词工具包。从2006.12推出1.0版本开始,IK Analyzer已经推出了多个版本,当前最新版本为20
c/c++运用nlpir进行自动化中文分词
由于毕业设计的需要,需要运用自动化分词和提取关键词,这个对于不专业的我还颇具难度,最开始把分词包直接加入到python中一直没有成功。在C下配置成功,记录一下步骤 用vs2013创建新项目,选择控制台程序,命名为nlpir 点击下一步,不要选中预编译头,然后点完成 在nlpir.cpp中写入下列代码(其中1.txt是待处理的文本):#include #include #inc
中文分词与关键词提取(NLPIR java版)
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;这个是java版本