关于C++中嵌入python 结巴分词

如题,在c++中想用到python的结巴分词库,我想的是把字符串传入py脚本,分词后再返回,但是会出现各种问题,而且jieba的对象类型不好处理,有没有大神可以提供下思路,有可行代码提供的,直接给分。跪求……

4个回答

注意py脚本中不要有print 会终止脚本,unicode类型转str的话,用encode('gbk')

如果觉得C++直接调用py脚本来处理,对象类型等不是很好处理,可以用一个中间介质的方式
把字符串写入文件,然后调用py脚本来处理,同样py脚本处理完写入另一个文件,然后让C++来读取。

z49434574
zzsnow336 回复oyljerry: 谢谢你的建议,不过还是用直接引入模块调用函数的办法。我重新做一次就通过了,不知道一开始是什么问题。还是谢谢你。
3 年多之前 回复

这样用python调用c应该比i骄傲好弄吧,你这个反过来了

结巴分词的c++实现https://github.com/yanyiwu/cppjieba

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
关于C++中嵌入python 结巴分词
如题,在c++中想用到python的结巴分词库,我想的是把字符串传入py脚本,分词后再返回,但是会出现各种问题,而且jieba的对象类型不好处理,有没有大神可以提供下思路,有可行代码提供的,直接给分。跪求……
C++中嵌入python脚本(结巴分词)
这篇主要讲如何在C++文件中,调用python脚本。下面我会结合我的分词程序的实例,介绍需要的函数和方法。 前段时间比较忙,六月份了,期末考试就陆续开始了。忙着复习,所以写这篇关于python嵌入C++的文章稍微晚了点,有一些细节记不太清了,如果有什么问题,欢迎大家联系我一起讨论。 前段时间在做 一个MFC界面的中文分词小程序的时候,发现了一些很有趣的事:传统的机械分词在处理一些较为阴
嵌入python中嵌入C
详细的讲述了,如何进行python和C的混合编程
关于PYTHON的嵌入C
PYTHON嵌入C\C++\C#这3种写法是不是一样的?这方面的资料太少了.几乎找不到什么资料.哪位大大能提供点资料~先谢过了
python中结巴分词快速入门
全几天看到高手下了个jieba分词快速入门的东西  ,希望关注我博客的人也能看得到 https://github.com/SalutLyndon/hello-world/blob/master/中文自然语言处理基本流 # coding: utf-8 # ###jieba特性介绍 # 支持三种分词模式: # 精确模式,试图将句子最精确地切开,适合文本分析;
Python中的结巴分词初探
python中的结巴分词有如下三种模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 主要功能 分词 jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数
Python之结巴分词
小白在Long Long ago研究过一段时间的结巴分词,当时是因为工作需要,很长时间过去了,有一点点生疏,现把之前学习的笔记整理一下,以便以后的使用,也分享一下~ 首先,需要先安装结巴分词包。 使用Anaconda prompt进行安装 pip install jieba spyder安装第三方包可参考小白之前的博客哦(https://blog.csdn.net...
python 结巴分词
昨天在处理发帖标题和内容,需要提取关键字。 首先要对句子进行分词。。。。经过一系列的查找,我决定用结巴分词来进行 介绍结巴分词  1.支持繁体 2.支持自定义词典 3.支持三种分词模式: 1:精确,适合文本分析 2:全模式,将句子所有可以成词的词语扫描出来,速度快,但不能解决句子的歧义 3:搜索引擎,在精确模式下,对长词进行再切割,使用搜索引擎分词 安装  python2
python结巴分词
# coding=utf-8 ''' Created on 2018年3月19日 @author: chenkai 结巴分词 支持三种分词模式: 精确模式: 试图将句子最精确地切开,适合文本分析; 全模式: 把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式: 在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引...
C中嵌入Python解释器
讨论C/C++中嵌入Python计算器的方法。
C中嵌入python的安全问题
C程序中嵌入python。rnC程序派发了多个线程,每个线程中执行python脚本。rn测试的时候程序会core掉,请问应该如何解决。多线程执行python脚本,为何会core?rn环境:unix
python 结巴分词的具体应用
#encoding=utf-8 # __author__ = 'Jason Han' import jieba # seg_list = jieba.cut("我来到北京清华大学", cut_all=True) # print "Full Mode:", "/ ".join(seg_list) # 全模式 seg_list = jieba.cut("保定市新市区乐凯北大街", cut_al
python与自然语言处理 2结巴分词
特点 1,支持三种分词模式:     a,精确模式,试图将句子最精确地切开,适合文本分析;      b,全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;      c,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 2,支持繁体分词 3,支持自定义词典 安装 1,Python 2.x 下
Python分词:结巴分词的安装使用
结巴分词1. 下载:jieba-0.38 (python2/3)都可用。 https://pypi.python.org/pypi/jieba2. 解压:将其解压到:D:\program\python\jieba-0.38 3. 安装:cmd进入该目录,执行 python setyp.py install 4. 测试(只要import jieba成功则安装成功) 参考链接:python中文分词
python 结巴分词(jieba)学习
原文地址:http://www.gowhich.com/blog/147?utm_source=tuicool&utm_medium=referral 源码下载的地址:https://github.com/fxsjy/jieba 演示地址:http://jiebademo.ap01.aws.af.cm/ 特点 1,支持三种分词模式:     a,精确模式,试图将句子最
python 结巴分词学习初探
# -*- coding: utf-8 -*- """ Created on Fri Nov 24 10:39:35 2017 @author: liub """ import jieba import jieba.posseg as pseg #支持三种分词模式: # #    精确模式,试图将句子最精确地切开,适合文本分析; #    全模式,把句子中所有的
python嵌入C语言
编写C语言文件,add.c #include <stdio.h> int add_int(int, int); float add_float(float, float); int add_int(int num1, int num2){ return num1 + num2; } float add_float(float num1, float num2){ ...
关于C中的SQL嵌入?
在高程的书在提到了SQL的嵌入式设计 rn还给出了C的例子 rn前面说了现在一般的宿主语言实现在SQL的嵌入一是靠编译器的支持,别一个就是设计成为预处理器。而现在的系统大多数是采用后者,就是能过预处理器。 rn我现在想问的是:turboc2有没有设计这样的处理器,如果有的话,怎么用它。有经验的给解解,谢谢了,顺便给一个简单的例子,比如说如何使用。 rn
结巴分词
https://github.com/fxsjy/jieba
python中嵌入C运行时函数
详细的文档看这里:https://docs.python.org/3.6/library/ctypes.html?highlight=ctypes#module-ctypes 需要注意的是文档中提到的几点: cdll 中的C函数的调用约定是cdecl 的,windll 中的C函数的调用约定是stdcall 的,Windows API专用。 1、Note Accessing
关于嵌入python的问题
Programming Python, 2nd Edition上的例子rnrnusermod.py 文件rnrnimport stringrnrnmessage = 'The meaning of life...'rnrndef transform(input):rn input = string.replace(input, 'life', 'Python')rn return string.upper(input)rnrnembed-object.c rnrn#include rnrnmain( ) rn char *cstr;rn PyObject *pstr, *pmod, *pfunc, *pargs;rn printf("embed-object\n");rn Py_Initialize( );rnrn /* get usermod.message */rn pmod = PyImport_ImportModule("usermod");rn pstr = PyObject_GetAttrString(pmod, "message");rnrn /* convert string to C */rn PyArg_Parse(pstr, "s", &cstr);rn printf("%s\n", cstr);rn Py_DECREF(pstr);rnrn /* call usermod.transform(usermod.message) */rn pfunc = PyObject_GetAttrString(pmod, "transform");rn pargs = Py_BuildValue("(s)", cstr);rn pstr = PyEval_CallObject(pfunc, pargs);rn PyArg_Parse(pstr, "s", &cstr);rn printf("%s\n", cstr);rnrn /* free owned objects */rn Py_DECREF(pmod);rn Py_DECREF(pstr);rn Py_DECREF(pfunc); /* not really needed in main( ) */rn Py_DECREF(pargs); /* since all memory goes away */rnrnrn不知为什么PyImport_ImportModule总返回为NULL,但如果PyImport_ImportModule("math")就能成功。rnrnrn
Python利用结巴分词进行中文分词
利用结巴分词进行中文分词,选择全模式,建立词倒排索引,并实现一般多词查询和短语查询 # -*- coding: utf-8 -*- import jieba ''' Created on 2015-11-23 ''' def word_split(text): """ Split a text in words. Returns a list of tuple that con
Python 数据挖掘学习 一 结巴分词
近期,想对古典小说进行索引,和知识挖掘,所以研究了下python数据挖掘方面的知识 Python安装 python学习 一 python语法,及变量类型 python学习 二 爬一个图片网站上 python学习 二 02 爬一个图片网站,获得主链接网址,并保存 python学习 二 03 爬一个图片网站-获得所有分页网址 python学习 二 04
C/C++ 嵌入Python问题
在C/C++代码里 调用python脚本中的函数。rn有没有这样的机制, 在python脚本执行过程中给C/C++代码发通知,告知C/C++当前脚本执行情况(例如任务完成进度)。rn类似回调的意思。rn
在c中嵌入sql
怎么与数据库建立连接rnsql 2000用c
C中嵌入SQL
本人学艺不精,请教各位:rn要在纯C中嵌入sql语句,需要包含哪些头文件??rn编译器是VC6.0
关于c中嵌入汇编的问题
以下程序为什么过不去?请高手帮改一下!谢谢 rn#include "stdio.h" rn#include "conio.h" rnint min(double v1,double v2)rnasm mov eax,v1;rnasm cmp eax,v2;rnasm jle minexit; rnasm mov eax,v2;rnminexit: rnreturn (_EAX);rn rnrnmain() rnprintf("min(10000,3) is %L\nmin(34000,552) is %L",min(10000,3),min(34000,552));rngetch(); rn
结巴分词--词性标注
1、简介 词性(part-of-speech)是词汇基本的语法范畴,通常也称为词类,主要用来描述一个词在上下文的作用。例如,描述一个概念的词就是名词,在下文引用这个名词的词就是代词。有的词性经常会出现一些新的词,例如名词,这样的词性叫做开放式词性。另外一些词性中的词比较固定,例如代词,这样的词性叫做封闭式词性。因为存在一个词对应多个词性的现象,所以给词准确地标注词性并不是很容易。例如,“改革”在
关于java中嵌入c语言代码
小弟由于要在java程序中实现对ip层的编程,而java又只提供TCP或UDP的SOCKET,所以想在JAVA中嵌入C语言。请各位大侠指点一下。
关于嵌入python 和脚本打包
这几天一直遇到这两个问题:rn查了好基本书还有官方文档以及Google.com 都没能解决, 所以想向前辈们请教,还望能解答,先谢了.rn一、我的脚本想放在一个目录中,然后将这些脚本全部打包成zip文件,但不知道如何打包已经在脚本程序或嵌入程序中怎么调用这个zip包中的模块?忘能给出代码。我是想以后程序可以直接用这个zip就能读到里面的模块,而不是为了发布安装python脚本库。 就类似于java中的jar那样的效果。rnrn二、因为我把脚本放在一个目录中,例如:rnrnScript rn |rn - Module rn |rn - Startup.py rnrn我知道如何在脚本中去调用这个Startup.py 模块(from Script.Module import Startup),但是不知道如何在嵌入程序中调用这个模块,一直都没能找到设置模块搜索路径的函数,好像只有察看的函数 Py_GetPath(), 可惜没有Py_SetPath() ,问题是不知道如何在嵌入程序中调用目录下的木块,以及是否有设置搜索路径的函数?rnrn等待前辈们的回答,谢谢。
扩展和嵌入Python之C++程序中嵌入Python解释器
大家好,我又回来了! 貌似和python结下了不解之缘,最近主要在做python的扩展和嵌入。 在正式写代码之前,先唠叨几句环境的搭建。当时搭建环境的时候也是费了一番辛苦。【叹气】 在嵌入和扩展Python时,需要调用python的c api,则需要包含Python.h,若想成功的将其包含,需要安装python dev。Ok,终于成功包含了Python.h,然后你欢天喜地的去运行程序了...
关于嵌入C的符号意思。
#define BIT3 (0x1 << 3)rnstatic int a;rnrnvoid set_bit3(void) rnrna |= BIT3;rnrnvoid clear_bit3(void) rnrna &= ~BIT3;rn rn其中 rn0X1〈〈3 MEAN?rn|= 什么意思?rna &= ~BIT3;什么意思,他的各个符号意思。rn
结巴分词 小结
不得不用到分词,但是中科院和哈工大感觉不太好装,反倒是结巴已经再python的源中了所以选择这个作为分词工具。1.下载安装没啥吧直接python easy_install.py jieba即可,import如果没什么问题就说明安装成功了。2.简介结巴的使用方法也很是简单,具体如下 结巴分词支持3中分词模式: 1,全模式:把句子中的所有可以成词的词语都扫描出来, 2, 精确模式:试图将文本最精确
结巴分词源代码
结巴分词的源代码,python。
结巴分词使用方法
0.下载      结巴分词包下载地址:http://download.csdn.net/detail/robin_xu_shuai/9691188 1.安装      将其解压到任意目录下,然后打开命令行进入该目录执行:python setup.py install 进行安装 2.测试       安装完成后,进入python交互环境,import jieba 如果没有报错,则
关于汇编嵌入C的一些问题?
unsigned short ContribTem[2048]; //C中定义的数组rn__asmrnrn//现在我要将数组中的任意位置连续4个字(64BIT)存入MMX0,要怎么做rnMOVQ MMX0 , ???? rnrn
结巴分词原理
介绍 结巴分词是一个受大家喜爱的分词库,源码地址为github,今天我们就跟进源码,看一下结巴分词的原理 原理 def cut(self, sentence, cut_all=False, HMM=True): ''' The main function that segments an entir...
结巴分词使用
# -*- coding:utf-8 -*- import re #正则 import jieba from wordcloud import WordCloud import jieba.analyse from collections import Counter import matplotlib.pyplot as plt #图片包 import pandas as pd #加载自定义词...
Jieba-Analysis 结巴分词
基于深度学习、语音识别的结巴分词Jieba-Analysis项目,可在Eclipse 和 Android Studio下运行,识别语音的同时,可将关键词分割并输出
中文分词库:结巴分词
文档地址:https://github.com/fxsjy/jieba 代码对 Python 2/3 均兼容 • 全自动安装:easy_install jieba 或者 pip install jieba / pip3 install jieba • 半自动安装:先下载 http://pypi.python.org/pypi/jieba/ ,解压后运行 python setup.py instal...
相关热词 c++和c#哪个就业率高 c# 批量动态创建控件 c# 模块和程序集的区别 c# gmap 截图 c# 验证码图片生成类 c# 再次尝试 连接失败 c#开发编写规范 c# 压缩图片好麻烦 c#计算数组中的平均值 c#获取路由参数