木胖子 2020-11-30 10:37 采纳率: 100%
浏览 135
已结题

【python爬虫】爬取变化网页

事情是这样的,我想写个小程序爬取路由器上设备带宽。网址上逻辑是这样的(每次刷新访问都是如下过程):

1.打开网址会先显示,正在加载,如下图(图片查看不了访问:http://picture.daemon.cool/view.php?p=16067035224537)

2.过大概一秒左右,进入业务页面,显示设备名称及带宽(图片查看不了访问:http://picture.daemon.cool/view.php?p=16067035223159):

 

 

我本人写的代码爬去设备的mac地址:

#!/usr/bin/python
# coding=utf-8
 
import requests,time
s=requests.session()
data = {
    'luci_username': 'root',
    'luci_password': 'password',
}
 
res = s.post('http://192.168.1.1', data)
while True:
    print(res.status_code)
    var = s.get(url='http://192.168.1.1/cgi-bin/luci/admin/nlbw/usage', ).content.decode('utf-8')
    if var.find("8c:ec:4b:b1:44:70") >= 0:
        print("8c:ec:4b:b1:44:70")
    if var.find("正在加载") >= 0:
        print("正在加载")

打印结果:

200
正在加载
200
正在加载
200
正在加载
200
正在加载
200
正在加载
200

求问,基于我的代码,如何爬取到第二个页面中的MAC地址,或者说如何持续爬一个有加载过程的页面?

  • 写回答

4条回答 默认 最新

  • 香芋味的猫 2020-11-30 11:02
    关注

    time.sleep(1)//等待一秒后在执行后续代码

    评论

报告相同问题?

悬赏问题

  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?