图片中文字定位识别tesseract如何增强文字框选范围呢？

在图片中查找文字定位查找到的定位乱七八糟，调了RIL_WORD以及RIL_TEXTLINE等等模式也不行

Box[1]:x=213,y=8,w=117,h=16,confidence:58,text:抗疫图片专栏姓名

像这种带连线的根本都分不开，要是能够达到腾讯QQ的文字识别效果就好了。
腾讯QQ的文字识别绝大多数都是可以做到把文字按一小块一小块的，它是如何做到的呢？

import net.sourceforge.tess4j.Tesseract;
import org.bytedeco.javacpp.BytePointer;
import org.bytedeco.leptonica.BOX;
import org.bytedeco.leptonica.BOXA;
import org.bytedeco.leptonica.PIX;
import org.bytedeco.tesseract.TessBaseAPI;
 
import java.io.File;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
import static org.bytedeco.leptonica.global.lept.*;
import static org.bytedeco.tesseract.global.tesseract.RIL_WORD;
 
public class imageUrl {
 
    public static void main(String[] args) throws Exception {
 
        BytePointer outtext;
 
        TessBaseAPI api = new TessBaseAPI();
 
        if (api.Init("tessdata", "zwp") != 0) {
 
            System.err.println("Could not initialalize tesseract");
 
            System.exit(0);
 
        }
        File file = new File("image.png");
 
        PIX image = pixRead(file.getAbsolutePath());
 
        image=pixConvertRGBToGrayFast(image);
 
        api.SetImage(image);
 
        int[] blockIds = {};
 
        long starttime = System.currentTimeMillis();
 
        BOXA boxes = api.GetComponentImages(RIL_WORD, true, null, blockIds);
 
        for (int i = 0; i < boxes.n(); i++) {
 
            BOX box = boxes.box(i);
 
            api.SetRectangle(box.x(), box.y(), box.w(), box.h());
 
            outtext = api.GetUTF8Text();
 
            String ocrresult = outtext.getString();
 
            int conf = api.MeanTextConf();
 
            String boxinformation = String.format("Box[%d]:x=%d,y=%d,w=%d,h=%d,confidence:%d,text:%s", i, box.x(),
                    box.y(), box.w(), box.h(), conf, ocrresult);
            System.out.println(boxinformation);
            outtext.deallocate();
        }
        api.End();
        pixDestroy(image);
        long invertaltime = System.currentTimeMillis() - starttime;
        System.out.println("识别用时:" + invertaltime);
    }
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
_雪菜肉丝面_ 2022-03-22 21:45
关注
获得1.70元问题酬金

我的想法：
1，腾讯强，而我们鸡。
2，简单点的做法还是记录下文字的位置，然后识别。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Java银行回单图片文字识别 java 人工智能
2021-09-23 11:53

回答 3 已采纳先去除表格的线条：遍历图像像素每一行，去除表格横线遍历图像像素每一列，去除表格竖线如何去除横线竖线：循环遍历一遍像素，连续超过N个像素颜色非背景色且颜色相同，则认为是一条线，替换成白色
OCR文字识别可以脱离Tesseract-OCR环境使用吗？ python
2022-07-19 23:00

回答 2 已采纳不能，Tesseract是他的框架
Tesseract这么清晰的图片都识别不了吗？ python 图像处理有问必答
2021-12-14 15:44

回答 2 已采纳添加 config='--psm 6'参数试试。pytesseract psm 选项参数设置可参考：https://blog.csdn.net/qq_26877377/article/details/
Tesseract-OCR.zip 图片文字识别无需安装，直接解压即可
2023-10-12 10:45

接着，它会检测图像中的文字区域，通过边缘检测和连通组件分析来定位文字框。最后，对每个文字框进行字符分割和识别，利用内置的字库模型匹配出最可能的文字，从而完成整个识别过程。 ### Tesseract OCR的特点与...
Tesseract-ocr 库无法识别图片 python 有问必答
2021-06-17 17:20

回答 2 已采纳图片放哪里都行，你路径没写对或者引入路径的格式写错了
apache Tika 图片识别tesseract-OCR改成tess4j.jar调用方式，求思路 intellij-idea jar java java-ee spring
2019-04-22 16:33

回答 1 已采纳参考tika-2293需求，已解决
在QT中使用tesseract，如何生成QT需要的依赖库include和lib？ qt
2018-05-11 01:48

回答 5 已采纳打开这个链接，应该可以解决你的问题https://blog.csdn.net/luoshi006/article/details/53188797
图片上文字识别tesseract的java实例小dome
2018-04-27 10:22

在名为“dome”的示例项目中，你将找到一个完整的Java程序，演示如何集成和使用Tesseract OCR进行图片文字识别。通过学习和理解这个示例，你可以将这项技术应用到自己的项目中，实现如文档扫描、自动填表等实用功能...
验证码识别，验证码训练tesseract、tesseract-ocr c# java python
2020-05-06 18:06

回答 1 已采纳看看是不是红框第一行这个文件没有找到，或者没有权限读取，或者文件损坏
tesseract-OCR如何通过vba语言获取识别字符串，而不通过生成txt文件的方式 python 有问必答
2021-05-02 21:32

回答 5 已采纳孙老师，这样的方法我理解，但是会出现exe运行边框，很难去除。那如何实现无边框运行，我试过采用输入一段代码，但还是有边框闪烁。
识别图片中的文本信息报错已经通过pip install pytesseract安装了相应库，如何解决？ python
2023-01-06 15:48

回答 2 已采纳没安装成功，卸载重装再试试。我猜
javacv对图片进行文字提取，定位指定文字在图片的位置坐标，提高识别速度
2022-05-02 21:29

在这个特定的应用场景中，我们利用 JavaCV 对图片进行文字识别（OCR，Optical Character Recognition），以定位并提取指定文字在图片中的位置坐标，同时优化识别速度。首先，我们需要了解 OCR 的基本概念。OCR ...
tesseract5.0验证码识别，四位数字，反回结果异常 python 爬虫
2022-03-07 12:44

回答 2 已采纳这你要把图片贴出来看呀，你的图片如果是彩色的话，是识别失败的
识别率很高的java文字识别技术
2020-09-01 18:15

总的来说，Java中的高识别率文字识别技术结合tesseract-ocr，可以有效地将图像中的文字转换为可编辑的文本，这对于文档自动化处理、表格数据抽取、纸质资料数字化等领域具有重要意义。通过不断优化图像处理和模型...
【项目管理】Java OCR实现图片文字识别
2022-10-21 20:48

李晋江的博客 Java OCR实现图片文字识别
javacv图片文字定位 https://blog.csdn.net/qq_37307077/article/details/111408748
2020-12-20 11:41

JavaCV图片文字定位技术主要涉及图像处理和计算机视觉领域，是一种高效地从图像中提取和定位文字的方法。本文将深入探讨这一技术，并结合Java语言，分析如何利用JavaCV库实现文字检测与定位。首先，JavaCV（Java ...
java使用tesseract-ocr进行文字识别
2023-02-23 15:29

满小超的代码世界的博客查找到使用java也能连接的OCR开源项目进行识别的学习。使用tesseract-ocr
Android中使用orc实现文字识别实例
2021-01-20 10:50

2. **定位文字区域**：先检测图像中的文字区域，再进行识别，减少背景干扰。 3. **训练模型**：如果需要识别特殊字体或专业术语，可以使用Tesseract提供的训练工具定制自己的识别模型。总之，OCR技术在Android应用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月22日

悬赏问题

¥15 关于pycharm, Callable[[str],bool]作为方法参数使用时, lambda 类型不提示问题
¥15 寻找了解qq家园纵横四海的程序猿。
¥15 optisystem
¥15 VB.NET画图时的撤销编程
¥15 C# webservice 参数特殊字符处理
¥15 关于控制时间更新的一个操作
¥15 JAVA中使用poi创建word文件，实现页面边框环绕页眉
¥15 matlibplot绘图图形切线问题
¥15 flink 深度优先搜索
¥15 python for everybody 使用Beautifulsoup构建soup对象的时候疯狂报错

图片中文字定位识别tesseract如何增强文字框选范围呢？

6条回答 默认 最新

问题事件

悬赏问题

6条回答默认最新