2 petalwin petalwin 于 2016.01.26 12:25 提问

菜鸟求助:怎么训练斯坦福分析器?

我在利用Stanford Parser对文本进行分析时发现有些结果和我想得到有些不同,想通过训练分析器来获得我想要的结果。
但是我在斯坦福自然语言小组的官网上只看到一些简单的训练命令,还有说道要用宾州树库来训练,我在网上找到了一个宾州树库的资源,里面有很多东西,但不知道应该怎么利用它们来训练分析器~~~
跪求大神帮帮我,说说训练分析器的步骤~~~
T-T要哭了,卡在这里好久了...
万分感激!

1个回答

devmiao
devmiao   Ds   Rxr 2016.01.27 22:20
Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
斯坦福分词训练步骤
首先浏览官网的FAQ:https://nlp.stanford.edu/software/segmenter-faq.html   D:\eclipse-workspace\Stanford_segmenter\导入的包>java-cp stanford-segmenter-3.7.0.jar -mx15g edu.stanford.nlp.ie.crf.CRFClassifier-pro
Stanford Parser中文句法分析器的使用
Contents 一、使用时注意两点 二、stanford parser 命令行使用 1  处理一个中文的句子 2  词性标注 和 生成 依存关系 3  图形工具界面 三、句法分析树标注集 一、使用时注意两点: 1。 中文内存大小设置:在运行--运行配置--自变量--vm参数中-加入:--Xmx1024m 2。 Tokenize指的是是否分词。一定选Tokeniz
斯坦福句法分析使用方法(java版)
斯坦福分析器java版使用教程,智能语言处理,句子相似度计算
使用Stanford NER训练自己的model
Standford NERStandford NER(Stanford Named Entity Recognizer )是斯坦福大学提供开源命名实体识别库,使用Java语言实现, 可以用来识别文本中的人名、地名、组织名称等实体。采用的是CRF分类器进行实体识别。使用Standford NER进行命名实体识别该过程参考官方文档 1. 下载源代码stanford-ner-2015-12-09.zip
关于斯坦福句法剖析器 -- 答网友
转载自:http://blog.sina.com.cn/s/blog_72d083c701017r9t.html                                    冯志伟 有网友问我:Stanford parser 和Berkeley parser 是哪种类型的分析器? 我觉得,Stanford parser基本上是一个词汇化的概率上下文无关语法分析器,同时也
Stanford Named Entity Recognizer (NER)简单应用实例
Stanford Named Entity Recognizer (NER)是斯坦福大学自然语言研究小组发布的成果之一, 其主页是:http://nlp.stanford.edu/software/CRF-NER.shtml Stanford NER 是一个Java实现的命名实体识别(以下简称NER))程序。NER将文本中的实体按类标记出来,例如人名,公司名,地区,基因和蛋白质的名字等
stanford nlp第四课“语言模型(Language Modeling)”
一、课程介绍 斯坦福大学于2012年3月在Coursera启动了在线自然语言处理课程,由NLP领域大牛Dan Jurafsky 和 Chirs Manning教授授课: https://class.coursera.org/nlp/ 以下是本课程的学习笔记,以课程PPT/PDF为主,其他参考资料为辅,融入个人拓展、注解,抛砖引玉,欢迎大家在“我爱公开课”上一起探讨学习。 课件汇
用Stanford NER训练自己的NER分类器
官方FAQ世界观:关于训练自己的分类器的文档官方没有~~, 但可以看java doc啊, So总是有办法的; 比如至少可以看看CRFClassifier和NERFeatureFactory这两个类.训练数据集格式tab-隔开的方式, word token一列, 分类标签一列; 不能使用空格隔开, 也不能有多余的tab; 一个空行表示分隔一个文档(document), 这里一个文档可以指一个句子或者一
[4]深度学习和Keras----斯坦福的一个可在线运行的卷积神经网络的Demo
学习深度学习,肯定要接触CNN(卷积神经网络)和RNN(循环神经网络),刚好斯坦福大学给出了一个在线的卷积神经网络的例子,方便大家学习和了解深度学习。这个Demo从MNIST数据库中取出了60000张28X28像素的图片作为训练的样本;那么什么是MNIST数据库呢》MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集。它是NIST数据库的一个子集。MNIST数据库官方网址为:http://yann.lecun.com/exdb/mnist/ ,也可以在windows下直接下载,
stanford-postagger-full词性标注
1 models介绍 该版本的词性标注工具中有一个models文件夹,该文件夹下有两种类型的文件:.tagger类型和. props类型。其中.tagger类型的文件是词性标注训练出来的模型文件,. props类型是其对应的properties文件。models文件夹下所有的文件如下图: 下面分别介绍该文件夹下主要的几个模型。 1.1  arabic.tagger Trainedon