red247green72blue81 2016-11-16 16:21 采纳率: 0%
浏览 1473
已结题

关于python爬虫抓取AJAX数据

最近看腾讯漫画海贼王的时候想直接爬下来一次过看了。

然后写爬虫的时候又一次遇到了JS加载出来的图片URLs让我又一次望而却步。

一直很想解决这一个难题但是看了很多都没有找到合适的解决方法。

我有Selenium库,但是觉得腾讯的漫画页的image URL好像不需要用到。

好想只要解读好它的JS就可以了,但是我读了很久的JS也读不出它是怎么加密的。

求大神解决我一直悬而未决的难题。

html_url_ :"http://ac.qq.com/ComicView/index/id/505430/cid/1"

js_url_: "http://ac.gtimg.com/media/js/ac.page.chapter.view_v2.3.5.js?v=20160826"

感激不尽。

  • 写回答

2条回答

  • oyljerry 2016-11-17 01:44
    关注

    一般主要是分析这个URL,http://ac.gtimg.com/media/js/ac.page.chapter.view_v2.3.5.js?v=20160826
    然后在它里面看能不能找到对应的图片地址等。

    评论

报告相同问题?

悬赏问题

  • ¥15 C++使用Gunplot
  • ¥15 这个电路是如何实现路灯控制器的,原理是什么,怎么求解灯亮起后熄灭的时间如图?
  • ¥15 matlab数字图像处理频率域滤波
  • ¥15 在abaqus做了二维正交切削模型,给刀具添加了超声振动条件后输出切削力为什么比普通切削增大这么多
  • ¥15 ELGamal和paillier计算效率谁快?
  • ¥15 file converter 转换格式失败 报错 Error marking filters as finished,如何解决?
  • ¥15 Arcgis相交分析无法绘制一个或多个图形
  • ¥15 关于#r语言#的问题:差异分析前数据准备,报错Error in data[, sampleName1] : subscript out of bounds请问怎么解决呀以下是全部代码:
  • ¥15 seatunnel-web使用SQL组件时候后台报错,无法找到表格
  • ¥15 fpga自动售货机数码管(相关搜索:数字时钟)