早饭. 2024-09-12 12:45 采纳率: 100%
浏览 9
已结题

python爬虫 tesserocr 工具报错

python3.12 虚拟环境 如何调用 系统基础环境中的 api

学习python爬虫有一个 光学识别 的工具 正常下载后没有问题,但是执行python代码的时候报错,个人的初步推断是因为 虚拟环境无法调用到系统环境中的api 在网上找了很多资料没有这方面的讲解,希望各位 能讲解一下

以下:

img


终端直接调用工具是可以正常执行的

img


使用Python调用就会报错
网上也查资料了,说是要把tesser data 放在报错目录 ,可是 我尝试了也是报错。

系统环境:Ubuntu20.04 python3.8.10 python3.12

img

虚拟环境是 python 的venv 创建的 以下是目录

img

  • 写回答

1条回答 默认 最新

  • 一轮明月照丘壑 2024-09-12 17:35
    关注

    以下回复参考:皆我百晓生券券喵儿等免费微信小程序作答:

    根据你的描述和提供的图片,问题似乎出在虚拟环境中无法正确找到 tesseracttessdata 路径。下面是一些建议和解决方案:

    检查 tessdata 路径

    首先确保你的 tessdata 文件夹包含正确的训练数据文件(如 eng.traineddata)。你需要找到这个文件夹并确保它位于你的系统的 PATH 中,或者在代码中指定正确的路径。对于 Python 中的 tesserocr 库,你可以通过设置环境变量 TESSDATA_PATH 来指定 tessdata 的路径。

    在虚拟环境中设置 TESSDATA_PATH

    你可以在虚拟环境中设置 TESSDATA_PATH 环境变量来指向 tessdata 文件夹的位置。在 Linux 中,你可以这样做:

    export TESSDATA_PATH=/path/to/your/tessdata
    

    在 Python 脚本中,你也可以使用 os.environ 来设置这个环境变量:

    import os
    os.environ['TESSDATA_PATH'] = '/path/to/your/tessdata'
    

    确保替换 /path/to/your/tessdata 为实际的路径。

    确保 tesserocr 正确安装

    检查你的虚拟环境中 tesserocr 是否正确安装。你可以尝试重新安装或更新它:

    pip install --upgrade tesserocr
    

    检查 Python 和 tesserocr 的兼容性

    你提到你正在使用 Python 3.12,而 tesserocr 可能不支持这么新的版本。尝试使用与 tesserocr 兼容的 Python 版本,例如 Python 3.8 或 3.9。你可以查看 tesserocr 的文档或其在 PyPI 上的页面来确认兼容的 Python 版本。

    使用系统全局安装的库

    如果你的系统已经安装了 tesseract 和相关的库,并且它们位于系统的 PATH 中,那么你可能需要在虚拟环境中避免重新安装这些库。你可以考虑在虚拟环境中运行你的脚本,而不是在全局环境中安装这些库。这样,虚拟环境可以访问系统级别的库和工具。

    总之,你需要确保 tesseract 和其相关的数据路径在正确的位置,并且你的 Python 环境能够访问它们。希望这些建议能帮助你解决问题!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月22日
  • 已采纳回答 9月14日
  • 修改了问题 9月12日
  • 创建了问题 9月12日

悬赏问题

  • ¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
  • ¥50 浦育平台scratch图形化编程
  • ¥20 求这个的原理图 只要原理图
  • ¥15 vue2项目中,如何配置环境,可以在打完包之后修改请求的服务器地址
  • ¥20 微信的店铺小程序如何修改背景图
  • ¥15 UE5.1局部变量对蓝图不可见
  • ¥15 一共有五道问题关于整数幂的运算还有房间号码 还有网络密码的解答?(语言-python)
  • ¥20 sentry如何捕获上传Android ndk 崩溃
  • ¥15 在做logistic回归模型限制性立方条图时候,不能出完整图的困难
  • ¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动,如何解决?