2402_87026163 2025-03-24 16:13 采纳率: 0%
浏览 12

Tesseract5 LSTM訓練,產生.lstmf內容為亂碼

.box檔案與.gt.txt檔案都已準備好
在生成.lstmf檔案指令:
tesseract testnum.normal.exp2.tif testnum.normal.exp2 -l chi_tra --psm 6 lstm.train

img

內容為亂碼,導致下一個步驟,做訓練時,無法進行

請問有前輩遇過此狀況嗎?要如何解??

感謝各位幫忙!在此感激不盡!

  • 写回答

3条回答 默认 最新

  • 道友老李 JWE233286一种基于机器视觉的水表指针读数识别及修正的方法 专利发明者 2025-03-24 16:38
    关注
    让【道友老李】来帮你解答,本回答参考gpt编写,并整理提供,如果还有疑问可以点击头像关注私信或评论。
    如果答案让您满意,请采纳、关注,非常感谢!
    根据你提供的信息,可能是因为训练数据中包含了乱码字符,导致无法正确进行训练。为了解决这个问题,你可以进行以下操作:
    1. 检查训练数据:确保训练数据中的所有字符都属于训练集(比如中文字符集),并且没有乱码字符。
    2. 如果确认训练数据中存在乱码字符,可以尝试重新生成训练数据,确保数据的准确性。
    3. 优化训练参数:尝试修改训练参数,比如增加训练次数、调整学习率等,以提高训练的效果。
    4. 如果仍然无法解决问题,可以尝试查看Tesseract的官方文档或寻求相关技术支持,获取更专业的帮助。 如果你需要实现代码来帮助解决问题,可以尝试以下Python代码段:
    import pytesseract
    from PIL import Image
    # 读取图像文件
    img = Image.open('testnum.normal.exp2.tif')
    # 使用Tesseract进行识别
    text = pytesseract.image_to_string(img, lang='chi_tra', config='--psm 6')
    # 输出识别结果
    print(text)
    

    希望以上信息对你有所帮助,祝顺利解决问题!

    评论

报告相同问题?

问题事件

  • 创建了问题 3月24日