我手头上有两个OCR软件开发包,清华的和汉王的。OCR软件识别率虽然很高了,但毕竟最后都需要人工处理比较多。我们是想把两个OCR利用起来把识别率提高一个数量级,不进行任何人工校对,使误差率达到万分之一以下,从而将OCR流水线化。请问各位高手我该如何实现?
PS:OCR开发包提供的函数可以取得图象的识别结果,识别字体的侯选字、可信度、
字体在图象中的定位边框,也就是字体在图象中的坐标。
我手头上有两个OCR软件开发包,清华的和汉王的。OCR软件识别率虽然很高了,但毕竟最后都需要人工处理比较多。我们是想把两个OCR利用起来把识别率提高一个数量级,不进行任何人工校对,使误差率达到万分之一以下,从而将OCR流水线化。请问各位高手我该如何实现?
PS:OCR开发包提供的函数可以取得图象的识别结果,识别字体的侯选字、可信度、
字体在图象中的定位边框,也就是字体在图象中的坐标。
用两个系统分别识别,然后比较识别的结果,把不同的挑出来,人工识别。前提是两个识别算法本身没有系统性(共性)的缺陷。