red247green72blue81 2016-11-16 16:21 采纳率: 0%
浏览 1473
已结题

关于python爬虫抓取AJAX数据

最近看腾讯漫画海贼王的时候想直接爬下来一次过看了。

然后写爬虫的时候又一次遇到了JS加载出来的图片URLs让我又一次望而却步。

一直很想解决这一个难题但是看了很多都没有找到合适的解决方法。

我有Selenium库,但是觉得腾讯的漫画页的image URL好像不需要用到。

好想只要解读好它的JS就可以了,但是我读了很久的JS也读不出它是怎么加密的。

求大神解决我一直悬而未决的难题。

html_url_ :"http://ac.qq.com/ComicView/index/id/505430/cid/1"

js_url_: "http://ac.gtimg.com/media/js/ac.page.chapter.view_v2.3.5.js?v=20160826"

感激不尽。

  • 写回答

2条回答 默认 最新

  • oyljerry 2016-11-17 01:44
    关注

    一般主要是分析这个URL,http://ac.gtimg.com/media/js/ac.page.chapter.view_v2.3.5.js?v=20160826
    然后在它里面看能不能找到对应的图片地址等。

    评论

报告相同问题?

悬赏问题

  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)