关于C++中嵌入python 结巴分词

如题,在c++中想用到python的结巴分词库,我想的是把字符串传入py脚本,分词后再返回,但是会出现各种问题,而且jieba的对象类型不好处理,有没有大神可以提供下思路,有可行代码提供的,直接给分。跪求……

0

4个回答

注意py脚本中不要有print 会终止脚本,unicode类型转str的话,用encode('gbk')

0

如果觉得C++直接调用py脚本来处理,对象类型等不是很好处理,可以用一个中间介质的方式
把字符串写入文件,然后调用py脚本来处理,同样py脚本处理完写入另一个文件,然后让C++来读取。

0
z49434574
zzsnow336 回复oyljerry: 谢谢你的建议,不过还是用直接引入模块调用函数的办法。我重新做一次就通过了,不知道一开始是什么问题。还是谢谢你。
大约 3 年之前 回复

这样用python调用c应该比i骄傲好弄吧,你这个反过来了

0

结巴分词的c++实现https://github.com/yanyiwu/cppjieba

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
delphi+Python结巴分词例子源代码
delphi+Python结巴分词例子源代码,用到组件PythonForDelphi
结巴分词、词性标注以及停用词过滤
因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。
C/C++嵌入Python脚本文件实例
C/C++嵌入Python脚本文件实例,以及在实现的过程中遇到的问题以及解决方法。
结巴分词Python代码
结巴分词,很不错的分词工具,python写的,亲身试用,不管英文还是中文分得很准!
结巴分词源代码
结巴分词的源代码,python。
结巴分词包利用tf-idf提取关键词
利用jieba包下的自带的函数进行关键词抽取,应用到的算法模型为TF-IDF,可以指定在哪些词中进行关键词抽取。
结巴分词及其Java、Python、C++的使用示例
压缩文件之中包含了结巴中文分词的说明文档,以及Java,Python,C++的使用示例。对于自然语言处理(NLP)有帮助。
嵌入python中嵌入C
详细的讲述了,如何进行python和C的混合编程
结巴分词(支持词性标注)
结巴分词早期版本。 * 结巴分词(java版) jieba-analysis 首先感谢jieba分词原作者[[https://github.com/fxsjy][fxsjy]],没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本。 结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。 结巴分词(java版)只保留的原项目针对搜索引擎分词的功能(cut_for_index、cut_for_search),词性标注,关键词提取没有实现(今后如用到,可以考虑实现)。 * 简介 ** 支持分词模式 - Search模式,用于对用户查询词分词 - Index模式,用于对索引文档分词 ** 特性 - 支持多种分词模式 - 全角统一转成半角 - 用户词典功能 - conf 目录有整理的搜狗细胞词库 - 支持词性标注(感谢 [[https://github.com/linkerlin][@linkerlin]] 的贡献) * 如何获取 - 当前稳定版本 #+BEGIN_SRC xml <dependency> <groupId>com.huaban</groupId> <artifactId>jieba-analysis</artifactId> <version>0.0.2</version> </dependency> #+END_SRC - 当前快照版本 - 支持词性标注 [[https://github.com/huaban/jieba-analysis/pull/4][#4]] - 修复以'-'连接词分词错误问题 [[https://github.com/huaban/jieba-analysis/issues/3][#3]] #+BEGIN_SRC xml <dependency> <groupId>com.huaban</groupId> <artifactId>jieba-analysis</artifactId> <version>1.0.0-SNAPSHOT</version> </dependency> #+END_SRC * 如何使用 - Demo #+BEGIN_SRC java @Test public void testDemo() { JiebaSegmenter segmenter = new JiebaSegmenter(); String[] sentences = new String[] {"这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。", "我不喜欢日本和服。", "雷猴回归人间。", "工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作", "结果婚的和尚未结过婚的"}; for (String sentence : sentences) { System.out.println(segmenter.process(sentence, SegMode.INDEX).toString()); } } #+END_SRC * 算法(wiki补充...) - [ ] 基于 =trie= 树结构实现高效词图扫描 - [ ] 生成所有切词可能的有向无环图 =DAG= - [ ] 采用动态规划算法计算最佳切词组合 - [ ] 基于 =HMM= 模型,采用 =Viterbi= (维特比)算法实现未登录词识别 * 性能评估 - 测试机配置 #+BEGIN_SRC screen Processor 2 Intel(R) Pentium(R) CPU G620 @ 2.60GHz Memory:8GB 分词测试时机器开了许多应用(eclipse、emacs、chrome...),可能 会影响到测试速度 #+END_SRC - [[src/test/resources/test.txt][测试文本]] - 测试结果(单线程,对测试文本逐行分词,并循环调用上万次) #+BEGIN_SRC screen 循环调用一万次 第一次测试结果: time elapsed:12373, rate:2486.986533kb/s, words:917319.94/s 第二次测试结果: time elapsed:12284, rate:2505.005241kb/s, words:923966.10/s 第三次测试结果: time elapsed:12336, rate:2494.445880kb/s, words:920071.30/s 循环调用2万次 第一次测试结果: time elapsed:22237, rate:2767.593144kb/s, words:1020821.12/s 第二次测试结果: time elapsed:22435, rate:2743.167762kb/s, words:1011811.87/s 第三次测试结果: time elapsed:22102, rate:2784.497726kb/s, words:1027056.34/s 统计结果:词典加载时间1.8s左右,分词效率每秒2Mb多,近100万词。 2 Processor Intel(R) Core(TM) i3-2100 CPU @ 3.10GHz 12G 测试效果 time elapsed:19597, rate:3140.428063kb/s, words:1158340.52/s time elapsed:20122, rate:3058.491639kb/s, words:1128118.44/s #+END_SRC
结巴中文分词
比较好的Python下的中文分词工具,但是速度不是特别快,可以看看我的博客说明
c++写的一个脚本解释器,可以嵌入到程序里由用户动态配置自己的程序
c++写的一个脚本解释器,可以嵌入到程序里由用户动态配置自己的程序
结巴分词中一部分自定义字典
本人在使用jieba分词做项目时,锁整理出来的一部分被切分的词
结巴分词的源代码
结巴分词,可以提供给eclipse等其他Java编译器,可以很好的进行分词
jieba分词支持关键词带空格和特殊字符
jieba分词支持关键词带空格和特殊字符
jieba分词词典和停用词
利用jieba分词进行文本的处理这里面是jieba分词所需要的词典和停用词
avr中嵌入汇编 iar中c与汇编混合编程
avr c中嵌入汇编编程文档说明 This application note describes how to set up and use the IAR C-compiler for the AVR controller in prosjects including both C and assembly code. By mixing C and assembly designers can combine the powerful C language instructions with the effective hardware-near assem- bly code instructions.
结巴分词jar包
jieba “结巴”中文分词:做最好的 Python 中文分词组件 "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word segmentation module. Scroll down for English documentation. 特点 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 支持繁体分词 支持自定义词典 MIT 授权协议 详情,见https://github.com/fxsjy/jieba
Jieba-Analysis 结巴分词
基于深度学习、语音识别的结巴分词Jieba-Analysis项目,可在Eclipse 和 Android Studio下运行,识别语音的同时,可将关键词分割并输出
如何用keil在C中嵌入汇编
如何用keil在C中嵌入汇编
jieba分词,连接数据库,分析数据库中的文本,并提取时间、地点、目标
jieba分词,连接数据库,分析数据库中的文本,并提取时间、地点、目标,整个完整流程/
jieba分词资源包
结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客
《C和C++嵌入系统编程》实例代码
一个关于《C和C++嵌入系统编程》实例代码
jieba分词的自定义词典
jieba分词的自定义词典:使用jieba分词对语料进行分词之前,需要先载入,载入代码为jieba.load_userdict("userdict.txt")。
matplotlib 绘图控件嵌入PyQt5 GUI中
案例包括点击画图功能,和显示 matplotlib 导航条功能(比如,显示保存、放大等功能按钮);但是,matplotlib 自带的导航条功能是英文的,做软件时用户用起来可能不方便。
可视化 词法分析器 设计 工具
一个利用作图的方法设计词法分析器的状态机,为编写词法分析程序提供便捷 用这个软件,你可以不费力的设计一个词法分析器 计算机语言的发展很有前途!! 本软件当前是测试版.....
Python Jieba中文分词工具实现分词功能
Python Jieba中文分词工具实现分词功能,Python Jieba中文分词工具实现分词功能
把自己的窗口嵌入桌面[源码]
.版本 2 窗口句柄 = 寻找顶级窗口 (“Progman”, “Program Manager”) ' Program Manager 桌面的标题 新父窗口 (取窗口句柄 (), 窗口句柄)
esql/c 总结 c中嵌入sql esql/c总结 比较 笔记 详细
c中嵌入sql esql/c总结 比较 笔记 详细 c中嵌入sql esql/c总结 比较 笔记 详细 c中嵌入sql esql/c总结 比较 笔记 详细
Python3实现Markdown生成的网页中嵌入本地图片
在Markdown生成的网页文件中,嵌入本地的图片。这样不管复制到哪里都可以使用了。本资源中有源码和可执行程序。
jieba结巴分词 支持lucene5
jieba分词器,支持lucene5版本。分词效果非常好,推荐使用。
flex-java整合研究配置
关于在Java中嵌入flex项目的配置及研究
java版本结巴分词
java版本结巴分词。添加了自定义分词、阻止词、分词词性等。
MT4 Python Binding
Metatrader Python Integration -- MT4 Python Binding.
jieba分词包
结巴分词包
Cao求相空间重构嵌入维数
本人测试,Cao法求嵌入维数,绝对有效,下载下来试试,Matlab实现
C.Inline.Perl
C.Inline.Perl 如何在c中嵌入perl
彩色图像经3维DWT变换嵌入水印
关于彩色图像中如何嵌入二值水印的代码,包含嵌入、提取及攻击程序
ARM中C语言和汇编语言混合编程
ARM中C语言和汇编语言混合编程 C语言调用汇编 汇编语言嵌入C中 混合编程
jieba+百度分词词库
jieba与百度的分词词库整合,加入了少量汽车行业的词语,剔除重复项之后剩余630406个词语。
java版结巴分词工具
java版结巴分词工具,一个很好的中文分词工具。直接用eclipse打开,输入是一篇文章,然后输出是每个词的词频,并且词频是按照大小从次数最高到次数最低排的,只需要在test包里改部分代码就可以使用了。 不下你会后悔的。
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 python结巴分词详细教程 结巴分词python教程