skjlgo 2021-08-24 15:09 采纳率: 91.7%
浏览 73
已结题

python3 爬虫问题:如何爬取文本从图片里面,破解这种图片反爬虫手段!

1.需要爬取的文本:
img
2.这个文本对应的元素代码处:
img
但是他对应是一张图片,加载这个网址可以看到里面的内容,但是是一张图片。
所以遇到这种反爬机制该怎样破解!
最终目的,是爬取到上面的文字,并且按照相应的格式排列。

  • 写回答

5条回答 默认 最新

  • CSDN专家-showbo 2021-08-24 16:07
    关注

    只能使用OCR识别了,没有什么好的办法,就是一张图片。你可以试试CSDN的图片识别,接口网址:https://bizapi.csdn.net/mp/ask/v1/ai/ocrText

    提问题时检查图片功能进行识别

    img

    或者百度文字识别OCR: https://ai.baidu.com/ai-doc/OCR/9k3h7xuv6
    在 控制台-免费资源领取页 可领取所需接口的免费测试资源。未实名认证 用户可领取 200 次/月,个人认证 1,000 次/月,企业认证 2,000 次/月。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 9月1日
  • 已采纳回答 8月24日
  • 创建了问题 8月24日