万师兄 2021-06-07 15:47 采纳率: 0%
浏览 96

Python爬虫如何获取京东图书分类链接地址?

京东图书全部分类地址:https://book.jd.com/booksort.html

如何获取图书全部分类下的各小类的地址?比如“中国当代小说”、“中国近现代小说”的地址?

看以前的爬虫,都是在网页里可以xpath直接提取,现在请求网页得到响应连div元素都没有了,全部都是js生成的。

好不容易找到了存储这些图书分类的json响应内容,可是按照请求的URL地址https://pjapi.jd.com/book/sort?source=bookSort&callback=jsonp_1623027377120_58538输入浏览器,浏览器给出非法请求的响应:

jsonp_1623027377120_58538({"code":-199,"data":null,"msg":"非法请求"})

彻底不知道该怎么获取这些链接了,爬虫之路第一步还没迈就被阻碍了。恳请大神指点!!

  • 写回答

2条回答 默认 最新

  • 献伟吖 2021-06-22 16:27
    关注

    博主解决了吗?我也遇到了

    评论

报告相同问题?