tesseract ocr 识别问题

图片说明图片说明](https://img-ask.csdn.net/upload/201608/23/1471934840_801587.png)

这两张图片有什么区别,我用tesseract ocr识别的时候,1.01可以识别出来,但只有一个1数字便不能识别出来

3个回答

这图片能识别出数字来?are you kidding me?

caozhy
贵阳老马马善福专门编写代码的老马就是我! 回复sky_calls00: 真能扯
大约 3 年之前 回复
sky_calls
sky_calls00 嗯 可以的,ocr就是专门做这种工作的
大约 3 年之前 回复

图片说明

sky_calls
sky_calls00 如上的2个图片,一个是1.01,一个是1,两张图片大小都一样
大约 3 年之前 回复

使用了下策 将图片转换成黑白的了

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
ocr文本识别tesseract
Tesseract OCR windows下载,完整的请到https://github.com/tesseract-ocr/tesseract
tesseract android ocr 识别 例子
ocr的源码 不用你在linix上面进行二次编译 不过需要你去下载语言包
Tesseract OCR多线程并发识别案例
Tesseract OCR多线程并发识别案例----只演示多线程并发识别,此工具不关注识别正确率,可通过训练tessdata来获得更高的识别正确率。
OCR识别OCR识别OCR识别OCR识别OCR识别
OCR识别OCR识别OCR识别OCR识别OCR识别OCR识别
OCR之Tesseract
esseract目前已作为开源项目发布在Google Project,其最新版本3.0已经支持中文OCR,并提供了一个命令行工具。
有关tesseract OCR的问题
我想调用谷歌提供的tesseract ocr开源代码,发现在无法用,我把开源代码发到工程下,无法调用!不知道那位大侠能帮助一下,怎么用C++去调用!麻烦给一个案例出来,我也在网上找好很多,但我用调用 的时候会出错很多地方 ,而且出错的地方都在tesseract ocr源码中!所以让我头痛啊?rn网上找的例子:rnrn#include "stdafx.h"rn#include "tesseract\baseapi.h"rn#include "tesseract\strngs.h"rnrnrnint _tmain(int argc, _TCHAR* argv[])rnrn const char * image = "image.jpg";rn rn tesseract::TessBaseAPI api;rn api.Init(NULL, "eng", tesseract::OEM_DEFAULT);rn api.SetVariable( "tessedit_char_whitelist",rn "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );rnrn STRING text_out;rn if (!api.ProcessPages(image, NULL, 0, &text_out))rn rn return 0;rn rnrn printf(text_out.string()); rnrn return 0;rnrnrnrn这个我在用得时候,不能调用会出现很多错误!求解决方法啊
Tesseract Ocr 引擎识别图形验证码
html, body { font-size: 15px; } body { font-family: Helvetica, 'Hiragino Sans GB', '微软雅黑', 'Microsoft YaHei UI', SimSun, SimHei, arial, sans-serif; line-
(RPA学习)内置 OCR 识别——Tesseract
个人分类: RPA教程 python基础 编辑 艺赛旗 RPA8.0全新首发免费下载 点击下载 http://www.i-search.com.cn/index.html?from=line1 详细内容请参看艺赛旗官网支持栏目:RPA社区 点击链接进入 http://support.i-search.com.cn/ 最近的需求中需要解决一些简单验证码的识别,于是我先在自己的电脑上使用Tessera...
OCR识别库tesseract源代码包
一个非常好用的OCR识别库tesseract源代码包。C++版本的代码。
OCR Tesseract 识别报 empty page
[b]我现在在弄一个中文的字库只有一种字体,根据每个汉字对应的生成一张图片,然后把多个汉字生成的BOX,TR文件进行合并,生成一个大的字库。rn现在问题是 对单个汉字生成的图片用这个cmd 命令生成box文件的时候 《tesseract chi_sim.宋体.的.jpg chi_sim.宋体.的 -l chi_sim batch.nochop makebox》 就会报 empty page 这个rn[img=https://img-bbs.csdn.net/upload/201709/25/1506325637_825800.png][/img]rn[img=https://img-bbs.csdn.net/upload/201709/25/1506325879_220040.png][/img]rn,不知道是什么原因。 在网上找了很多资料,也没找到具体的原因,之后看了下生成后的box文件中的内容 ,其实就是 《字 X Y 高 宽》这种内容rn,所以在生成box文件的时候 ,就手动创建了一个box类型的文件然后往里面写内容,这个问题就跳过了,到后面还有一步很重要的操作,用这个cmd《tesseract chi_sim.宋体.地.tif chi_sim.宋体.地 nobatch box.train》,就是生成tr文件,这个时候也需要用到汉字生成的图片,问题又回到之前了,生成tr 的时候,也会报 empty page ,rn[img=https://img-bbs.csdn.net/upload/201709/25/1506325849_698796.png][/img]rn有时候生成tr 也会报这种rn[img=https://img-bbs.csdn.net/upload/201709/25/1506326931_476251.png][/img]rn然后我又想用之前box 的方法 手动去写,但是tr 里面的内容看不懂,没法手动写,之前也没搞过ocr识别,就卡在这了,有没有兄弟遇到过这种问题, 我一直怀疑是不是生成图片的问题 ,因为单个汉字生成的图片只有1-2KB ,搞不懂,跪求啊
Opencv2.2 + Tesseract 图片处理以及OCR识别源码
本源码采用VS2010编写,其中包含了OPENCV 处理图片的多种方法,如 二值化、多种方式去噪点算法,图片翻转,该源码生成为DLL文件,作为研究OPENCV 以及 Tesseract3.02 的图像处理和识别学习采用,该源码以成功应用商业上。
VS2005编写的Tesseract OCR识别英文字母
VS2005编写的Tesseract OCR识别英文字母,可以成功识别出字母
Tesseract OCR 识别语言编码 简体中文chi_sim
Teseeract ORC 是一款开源的ORC识别库。备注下识别语言编码:简体中文是chi_sim。Tesseract uses 3-character ISO 639-2 language codes。 如下从其gitHub摘抄的:地址:https://github.com/tesseract-ocr/tesseract/blob/a75ab450a8cc9a2b69cf05f5c4f7a39
使用Tesseract OCR Engine识别图片文字
目前有很多OCR工具或者类库都提供了准确率挺高的PDF和图片识别功能。在爬虫应用中,时常需要识别验证码或者目标站点处于数据保护而使用图片来替代直接的文本。除了直接的软件和类库外,还有一些在线工具可以直接识别,使用free online ocrGooglr可以搜索到下面这几个: http://www.onlineocr.net/ http://www.free-ocr.com/ http://www.
使用Tesseract对图片文字OCR识别
使用Tesseract对图片文字OCR识别 前言 想用Python对身份证图片进行OCR识别,提取出身份证上面的文字,但是不想依赖网络上提供的第三方的接口(比如Face++提供的身份证OCR识别),因为将身份证的照片上传到这样的接口进行识别,很可能会泄露用户的隐私信息等。所以就想用Python在本地进行图片文字OCR识别。 Tesseract是一款被广泛使用的开源 OCR 工具,本文将对...
tesseract ocr训练样本库 识别字库
原文地址 http://blog.csdn.net/qq_25806863/article/details/67637567在上一篇文章tess_two Android图片文字识别中,使用tess_two完成了简单的文字识别。 简书地址 但是发现一个很明显的问题是,默认的识别速度比较慢。识别四个很明显的字需要将近两秒。 DemoGitHub可以试试。tess_two用的是tesseract o
mac ocr识别小程序,依赖tesseract
mac ocr识别小程序,依赖tesseract,如何有帮助请点赞评论偶!
OCR tesseract中文无法识别问题
最近因为公司项目需求的原因,在学习使用OCR tesseract,关于自己的学习想在这做个简单的概括,希望能帮到遇到同样问题的人。关于tesseract的使用,网上的博客已经有很多详细的讲解,在这我就说说我遇到的问题:中文无法识别。一开始我也特别不理解,都是按照教程来的,为什么就是不行,一直报下面这个问题 后来经过多番搜索查阅才知道是因为中文包的版本和tesseract.exe的版本
Tesseract OCR 3.05.01 exe
Tesseract OCR 3.05.01 最新最稳定OCR版本 Tesseract OCR 3.05.01 最新最稳定OCR版本 Tesseract OCR 3.05.01 最新最稳定OCR版本
【工具】tesseract 简单的ocr
识别图片文字 一款简单的图片转文字的工具,适用于电子文字的图片,纯文字还行,准确率一般90%左右 安装 brew install tesseract 源代码安装 git clone https://github.com/tesseract-ocr/tesseract.git ./autogen.sh ./configure make make install sudo ldco...
ocr字符识别安装 tesseract
1.配置源,对于CentOS 7,以root身份运行以下命令: yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/ sudo rpm --import https://build.opensuse.org/projects/home...
Tesseract OCR 3.03 VS2013
Tesseract OCR识别的源码,对应Tesseract 3.03版本,VS编译器为vs2013。可以直接将图片中的文字进行识别,中文OCR,并提供了一个命令行工具,转换成文本信息。
tesseract识别汉字问题
tesseract怎么连这样的一张图片的汉字也认不出来?rn[img=https://img-bbs.csdn.net/upload/201709/15/1505464720_533885.jpg][/img]rn我用的是tesseract-ocr-setup-3.02.02安装包安装的,网上下载的一个中文语言包:rn[img=https://img-bbs.csdn.net/upload/201709/15/1505464980_176745.jpg][/img]rn(其它这样的图片认识别率还挺高的)
OCR加入Tesseract 验证码识别
先右击解决方案还原nuget,可阅读read.txt,两个页面可以自行测试看看结果,新增Tesseract.dll 验证码识别 读出来的结果需要 code.Replace("\r\n", ""); 以及去掉空格等操作
Tesseract OCR 字符识别
请问大家,对Tesseract OCR 算法原理了解吗?虽然也看过An Overview of the Tesseract OCR Engine和Adapting the Tesseract Open Source OCR Engine for Multilingual OCR 这两篇文章。但是具体的算法还是了解不了或者说是不理解,能不能请各位大神帮忙发表一下自己对Tesseract OCR 的算法原理的理解。谢谢啦!!
Android Tesseract OCR
Android Tesseract OCR光学字符识别相关的资料,主要来自github
tesseract OCR 源码
Google支持的开源的OCR图文识别开源项目。去持多语言(版本支持包括英文,简体中文,繁体中文),支持Windows,Linux,Mac OSX 多平台。使用中Tesseract 的识别率非常高。可以在项目网站下https://github.com/tesseract-ocr(以前在http://code.google.com/p/tesseract-ocr,现在已经转移到github下,不用翻Q就可以down了)
tesseract ocr(图像识别类库)
OCR引擎。tesseract-ocr就是OCR引擎,在1985年到1995年由HP实验室开发,现在在Google。tesseract-ocr 3.0发布,支持中文。不过tesseract-ocr 3.0不是图形化界面的客户端,别人写的FreeOCR图形化客户端还不支持导入新的 3.0 traineddata
ocr tesseract中文字库
ocr-tesseract中文字库,ocr-tesseract中文字库,ocr-tesseract中文字库
OCR 开源软件_tesseract
google OCR 开源项目 比较老的东西,效果还可以
OCR 工具tesseract初体验
OCR 工具tesseract初体验 @(工具使用)[工具使用, python] OCR即图片上文字识别 安装tesseract github地址 tesseract是一个命令行程序,后面安装的pytesseract也只是一层包装,实际还是调用命令行 下载 windows版下载地址 安装 下载完之后安装时点下一步慢点,因为安装的时候可以下载中文语言包
tesseract 图像识别 OCR
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生。在2005年,Tesseract由美国内华达州信息技术研究所获得,并委托Google对其进行改进、优化工作。 Tesseract目前已作为开源项目发布在Google Project,它与Leptonica图片处理库结合,可以读取各种格式的图像并将它们转化成超过60种语言的文本,我们还可以不断训练自己的库,使图像转换文本的能力不断增强。如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
tesseract OCR引擎
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。
tesseract ocr文字识别示例
tesseract ocr文字识别 C++ 代码示例
OCR Tesseract 文字识别 安卓
OCR Tesseract 文字识别 安卓
google的OCR Tesseract询问
Bitmap image = new Bitmap("D:\\temp\\ff.gif");rn tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类rn ocr.SetVariable("tessedit_char_whitelist", "0123456789"); //设置识别变量,当前只能识别数字。rn ocr.Init(@"D:\tessdata", "eus", true); //应用当前语言包。 rn List result = ocr.DoOCR(image, Rectangle.Empty);//执行识别操作rnrn 有哪位大侠这样用过吗,我用的结果识别总是不对呀
Tesseract 3.0 (google OCR)
Tesseract OCR windwos 安装包
Tesseract OCR 语言包下载
esseract OCR语言包的下载地址https://github.com/tesseract-ocr/tessdata图中的是简体中文包。
tesseract ocr下载
Tesseract是一个 由HP实验室开发 由Google维护的 开源的光学字符识别(OCR)引擎,可以在 Apache 2.0 许可下获得。它可以直接使用,或者(对于程序员)使用 API​​ 从图像中提取输入,包括手写的或打印的文本。
OCR识别 Nicomsoft OCR
Nicomsoft OCR识别引擎SDK,支持32位、64位,支持VC VB JS、等开发语言,很好的识别引擎,识别能力不输清华文通OCR!
相关热词 c# 标准差 计算 c#siki第五季 c#入门推荐书 c# 解码海康数据流 c# xml的遍历循环 c# 取 查看源码没有的 c#解决高并发 委托 c#日期转化为字符串 c# 显示问号 c# 字典对象池