skjlgo
2021-08-24 15:09
采纳率: 91.5%
浏览 69
已结题

python3 爬虫问题:如何爬取文本从图片里面,破解这种图片反爬虫手段!

1.需要爬取的文本:
img
2.这个文本对应的元素代码处:
img
但是他对应是一张图片,加载这个网址可以看到里面的内容,但是是一张图片。
所以遇到这种反爬机制该怎样破解!
最终目的,是爬取到上面的文字,并且按照相应的格式排列。

  • 写回答
  • 好问题 提建议
  • 追加酬金
  • 关注问题
  • 收藏
  • 邀请回答

5条回答 默认 最新

  • CSDN专家-showbo 2021-08-24 16:07
    已采纳

    只能使用OCR识别了,没有什么好的办法,就是一张图片。你可以试试CSDN的图片识别,接口网址:https://bizapi.csdn.net/mp/ask/v1/ai/ocrText

    提问题时检查图片功能进行识别

    img

    或者百度文字识别OCR: https://ai.baidu.com/ai-doc/OCR/9k3h7xuv6
    在 控制台-免费资源领取页 可领取所需接口的免费测试资源。未实名认证 用户可领取 200 次/月,个人认证 1,000 次/月,企业认证 2,000 次/月。

    评论
    解决 无用
    打赏 举报
查看更多回答(4条)

相关推荐 更多相似问题