niiiiiiiiiys 2021-05-17 16:12 采纳率: 100%
浏览 163
已采纳

爬取类似快看漫画网页无法获取到完整的元素

我在爬取快看漫画过程当中无法获得完整的元素,该怎么办,具体情况是

为什么无法获得noinit之后的属性?

爬取结果

我的代码

#! python3
#downloadkkmh.py - Downloads every single KKMH comic.

import requests,os,bs4,lxml

picnum=0
url='https://www.kuaikanmanhua.com/web/comic/316174/'
header={"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36"}
os.makedirs('kkmh',exist_ok=True)

res=requests.get(url,headers=header)
res.raise_for_status()

soup=bs4.BeautifulSoup(res.text,'lxml')

elem=soup.select('.imgList img')
for i in range(len(elem)):
    print(str(elem[i]))
  • 写回答

3条回答 默认 最新

  • lucky_morning 2021-05-17 16:23
    关注

    这个是简单的反爬虫机制,数据没有直接渲染在html元素上,而是在js中,然后再用js脚本去把数据渲染在html元素中,页面我看了  在最下面的页面script标签里面有漫画的url地址,你可以用正则去取

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥60 pb数据库修改或者求完整pb库存系统,需为pb自带数据库
  • ¥15 spss统计中二分类变量和有序变量的相关性分析可以用kendall相关分析吗?
  • ¥15 拟通过pc下指令到安卓系统,如果追求响应速度,尽可能无延迟,是不是用安卓模拟器会优于实体的安卓手机?如果是,可以快多少毫秒?
  • ¥20 神经网络Sequential name=sequential, built=False
  • ¥16 Qphython 用xlrd读取excel报错
  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
  • ¥15 相敏解调 matlab
  • ¥15 求lingo代码和思路