.box檔案與.gt.txt檔案都已準備好
在生成.lstmf檔案指令:
tesseract testnum.normal.exp2.tif testnum.normal.exp2 -l chi_tra --psm 6 lstm.train

內容為亂碼,導致下一個步驟,做訓練時,無法進行
請問有前輩遇過此狀況嗎?要如何解??
感謝各位幫忙!在此感激不盡!
.box檔案與.gt.txt檔案都已準備好
在生成.lstmf檔案指令:
tesseract testnum.normal.exp2.tif testnum.normal.exp2 -l chi_tra --psm 6 lstm.train

內容為亂碼,導致下一個步驟,做訓練時,無法進行
請問有前輩遇過此狀況嗎?要如何解??
感謝各位幫忙!在此感激不盡!
关注让【道友老李】来帮你解答,本回答参考gpt编写,并整理提供,如果还有疑问可以点击头像关注私信或评论。
如果答案让您满意,请采纳、关注,非常感谢!根据你提供的信息,可能是因为训练数据中包含了乱码字符,导致无法正确进行训练。为了解决这个问题,你可以进行以下操作:
import pytesseract
from PIL import Image
# 读取图像文件
img = Image.open('testnum.normal.exp2.tif')
# 使用Tesseract进行识别
text = pytesseract.image_to_string(img, lang='chi_tra', config='--psm 6')
# 输出识别结果
print(text)
希望以上信息对你有所帮助,祝顺利解决问题!