问题是这样的:我用了中科院分词器的python版本的api,pynlpir,它可以支持对文件进行分词操作。
但是对于单行的文本文件可以分词,对于多行的文本文件不能分词,这是什么情况。这是我下面的调用接口:
#对文件进行分词
def splitFile(sSrcFileName , sDstFileName):
if not nlpir.Init(nlpir.PACKAGE_DIR , nlpir.UTF8_CODE , None):
logging.INFO("初始化分词器失败")
return False
nlpir.FileProcess(sSrcFileName , sDstFileName , False)
nlpir.Exit()
return True
我需要分词的文件为:a.txt,它的内容如下:
Point(1.687499,-6.458334,{A});
Point(7.229166,-4.583334,{B});
Segment(5,6,{});
PointFlexRotate(5,6,1/2,t,{C});
Segment(6,8,{});
Parallelogram(8,6,5,{D});
Segment(8,10,{});
Segment(10,5,{});
PointOnLine(7,{E});
Segment(6,13,{});
Variable(t,124.000000,173.000000,{});
PointFlexRotate(13,6,1,t,{G});
Segment(6,16,{});
Translate(13,6,16,{H});
Translate(13,16,8,{J});
Translate(16,13,5,{K});
Translate(20,18,19,{L});
Point(7.354165,2.083333,{M});
Segment(18,22,{});
Translate(19,18,22,{N});
。。。
后面还有
多行的文件调用这个更接口后,python程序在走到nlpir.FileProcess(sSrcFileName , sDstFileName , False)这个地方就停住不动了
请教各位朋友,这是什么情况,pynlpir不支持多行内容的文件进行分词吗?有什么解决方法?十分感谢