niiiiiiiiiys 2021-05-17 16:12 采纳率: 100%
浏览 163
已采纳

爬取类似快看漫画网页无法获取到完整的元素

我在爬取快看漫画过程当中无法获得完整的元素,该怎么办,具体情况是

为什么无法获得noinit之后的属性?

爬取结果

我的代码

#! python3
#downloadkkmh.py - Downloads every single KKMH comic.

import requests,os,bs4,lxml

picnum=0
url='https://www.kuaikanmanhua.com/web/comic/316174/'
header={"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36"}
os.makedirs('kkmh',exist_ok=True)

res=requests.get(url,headers=header)
res.raise_for_status()

soup=bs4.BeautifulSoup(res.text,'lxml')

elem=soup.select('.imgList img')
for i in range(len(elem)):
    print(str(elem[i]))
  • 写回答

3条回答 默认 最新

  • lucky_morning 2021-05-17 16:23
    关注

    这个是简单的反爬虫机制,数据没有直接渲染在html元素上,而是在js中,然后再用js脚本去把数据渲染在html元素中,页面我看了  在最下面的页面script标签里面有漫画的url地址,你可以用正则去取

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置