pynlpir中为什么分词器对于多行的文件不能分词

问题是这样的：我用了中科院分词器的python版本的api，pynlpir，它可以支持对文件进行分词操作。
但是对于单行的文本文件可以分词，对于多行的文本文件不能分词，这是什么情况。这是我下面的调用接口：
#对文件进行分词
def splitFile(sSrcFileName , sDstFileName):
if not nlpir.Init(nlpir.PACKAGE_DIR , nlpir.UTF8_CODE , None):
logging.INFO("初始化分词器失败")
return False
nlpir.FileProcess(sSrcFileName , sDstFileName , False)
nlpir.Exit()
return True

我需要分词的文件为:a.txt，它的内容如下：
Point(1.687499,-6.458334,{A});
Point(7.229166,-4.583334,{B});
Segment(5,6,{});
PointFlexRotate(5,6,1/2,t,{C});
Segment(6,8,{});
Parallelogram(8,6,5,{D});
Segment(8,10,{});
Segment(10,5,{});
PointOnLine(7,{E});
Segment(6,13,{});
Variable(t,124.000000,173.000000,{});
PointFlexRotate(13,6,1,t,{G});
Segment(6,16,{});
Translate(13,6,16,{H});
Translate(13,16,8,{J});
Translate(16,13,5,{K});
Translate(20,18,19,{L});
Point(7.354165,2.083333,{M});
Segment(18,22,{});
Translate(19,18,22,{N});
。。。
后面还有

多行的文件调用这个更接口后，python程序在走到nlpir.FileProcess(sSrcFileName , sDstFileName , False)这个地方就停住不动了
请教各位朋友，这是什么情况,pynlpir不支持多行内容的文件进行分词吗？有什么解决方法？十分感谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
iamcoolandcrazy 2016-02-02 02:39
关注
同问，我用他自带的python接口seg(paragraph)，老是崩溃，把同样内容放到他的网页上测试就解析的很好，不懂他们是怎么用的

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python实现中文分词，jieba库实现中文分词自然语言处理
2022-11-24 22:45

回答 1 已采纳这是详细的教程https://blog.csdn.net/weixin_44095417/article/details/121146386
实现bigram分词系统的python代码 python 中文分词
2023-03-28 19:25

回答 1 已采纳实现bigram分词系统可以使用Python中的基础字符串处理函数和一些基本的数据结构。下面是一个简单的实现过程：定义一个词典：可以将一个包含大量单词的文本文件读入一个列表中，每个单词作为列表的一个
导入xlsx文件为DataFrame类型，转换为列表，分词后中括号和引号无法去除 python 有问必答
2021-09-11 21:44

回答 2 已采纳转换为列表之后再用 " ".join()拼接成字符串不行吗?
python实现中文分词FMM算法实例
2020-09-21 22:13

主要介绍了python实现中文分词FMM算法,实例分析了Python基于FMM算法进行中文分词的实现方法,涉及Python针对文件、字符串及正则匹配操作的相关技巧,需要的朋友可以参考下
结巴问题：为什么我输出不了slist (结巴分词后的结果）？ python
2021-12-27 17:53

回答 1 已采纳 jieba.cut()返回的是一个迭代器，只能迭代一次你第8行在遍历后就为空了，所以13行没办法join()了可以在第8行前加一句： slist = list(slist)
关于C++中嵌入python 结巴分词 c++ python
2016-05-26 07:15

回答 4 已采纳注意py脚本中不要有print 会终止脚本，unicode类型转str的话，用encode('gbk')
文件已经分词了，词云也成功了，为什么在文件里查不到ss.png? python
2021-05-28 23:05

回答 2 已采纳你试试我这个 import hanlp import imageio import wordcloud def tokenizer_zh(text): tokenizer = ha
Python中文分词工具之结巴分词用法实例总结【经典案例】
2020-09-21 09:13

主要介绍了Python中文分词工具之结巴分词用法,结合实例形式总结分析了Python针对中文文件的读取与分词操作过程中遇到的问题与解决方法,需要的朋友可以参考下
Python的jieba库输出全部分词哪里出了问题 python
2022-06-02 11:36

回答 1 已采纳代码没错，只是你输出的内容错了可以参考 jieba.cut与jieba.lcut的区别_blackieliu的博客-CSDN博客_jieba.cut
python中jieba分词怎么把字母一个一个单独分开。 python 中文分词自然语言处理
2020-07-29 18:51

回答 1 已采纳 ``` import re sentence="hello你好" result=re.sub(r"([a-zA-Z])",r"\1 ", sentence) print(result.rs
政府工作报告进行分词 Python python
2021-12-12 15:26

回答 2 已采纳参考这个例子应该能解决你的需求 https://blog.csdn.net/xiexf189/article/details/77477283
如何利用pynlpir进行中文分词并保留段落信息
2024-03-01 09:25

PythonFun的博客 nlpir是由张华平博士开发的中文自然处理工具，可以对中文文本进行分词、聚类分析等，它既有在线的中文数据大数据语义智能分析平台，也有相关的python包pynlpir。
python怎么把jieba分词后的结果导入excel中啊
2017-07-19 15:45

回答 1 已采纳 http://blog.csdn.net/u014070086/article/details/73201590
Python 如何对读取的文件内容进行分词 Python源码
2023-11-03 09:26

Python 如何对读取的文件内容进行分词 Python源码Python 如何对读取的文件内容进行分词 Python源码Python 如何对读取的文件内容进行分词 Python源码Python 如何对读取的文件内容进行分词 Python源码Python 如何对...
python jieba分词并统计词频后输出结果到Excel和txt文档方法
2020-09-20 19:07

本篇文章主要介绍了python jieba分词并统计词频后输出结果到Excel和txt文档方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
没有解决我的问题, 去提问

悬赏问题

¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？

pynlpir中为什么分词器对于多行的文件不能分词

1条回答 默认 最新

悬赏问题

1条回答默认最新