为什么通过selenium+browsermob-proxy获取到的请求不全呢？

技术框架：selenium + browsermob-proxy
selenium 获取页面元素
browsermob-proxy 获取请求信息

场景1：打开Chrome，输入localhost:8082，在NetWork中可以看到有23个请求，并且其中有我要的业务请求
图片说明

场景2：通过selenium + browsermob-proxy程序，打开localhost:8082，只能获取到6个请求，其他请求丢失了，这是为什么呢？
图片说明

我的代码

from browsermobproxy import Server
from selenium import webdriver
import os
from urllib import parse
from time import sleep

server = Server(r'/Users/renguanyu/app/browsermob-proxy/2.1.4/bin/browsermob-proxy')
server.start()
proxy = server.create_proxy()

chromedriver = "/usr/local/bin/chromedriver"
os.environ["webdriver.chrome.driver"] = chromedriver
url = parse.urlparse (proxy.proxy).path
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--ignore-certificate-errors')
chrome_options.add_argument("--proxy-server={0}".format(url))
driver = webdriver.Chrome(chromedriver,chrome_options =chrome_options)
driver.implicitly_wait(60)
proxy.new_har("http://localhost:8082/", options={'captureHeaders': True,'captureContent': True})
driver.get("http://localhost:8082/")
sleep(3)

# 打印network
result = proxy.har
log = result["log"]
entries = log["entries"]
list = []
for entrie in entries:
    request = entrie["request"]
    request_url = request["url"]
    response = entrie["response"]
    status = response["status"]

    dict = {
        "url": request_url,
        "status": status
    }
    list.append(dict)

# sleep(30)
print("request_list")
for item in list:
    print(item)
print("request_list_length", len(list))

proxy.close()
driver.quit()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
星光不问赶路人~ 2020-09-15 19:31
关注
from browsermobproxy import Server
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time

server = Server("D:\apk\lyl\browsermob-proxy-2.1.4\bin\browsermob-proxy.bat")
server.start()
proxy = server.create_proxy()

chrome_options = Options()
chrome_options.add_argument('--proxy-server={0}'.format(proxy.proxy))

driver = webdriver.Chrome(chrome_options=chrome_options)
#要访问的地址
base_url = "www.abc.coml"
proxy.new_har("ht_list2", options={ 'captureContent': True})

driver.get(base_url)
#此处最好暂停几秒等待页面加载完成，不然会拿不到结果
time.sleep(3)
result = proxy.har

for entry in result['log']['entries']:
_url = entry['request']['url']
print(_url)
# # 根据URL找到数据接口,这里要找的是 http://git.liuyanlin.cn/get_ht_list 这个接口
if "http://git.liuyanlin.cn/get_ht_list" in _url:
_response = entry['response']
_content = _response['content']
# 获取接口返回内容
print(_response)

server.stop()
driver.quit()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

Selenium+Browsermob-Proxy 爬虫-获取浏览器Network请求和响应
2022-06-04 16:22

wg2627的博客 Selenium 3 + BrowserMobProxy 2.1.4
Selenium+Browsermob-Proxy获取浏览器Network请求和响应
2020-10-26 22:24

MingT-L的博客尝试使用Selenium和Browsermob-Proxy把network里面的数据扒下来。个人觉得这样扒数据又全又清晰，遂写下本文记录扒拉勾网数据时的踩坑过程。还用于个人回顾或给正在坑里的朋友提供一丢丢一丢丢的帮助。 Selenium ...
selenium+python+browsermob-proxy获取network中请求和响应的方法
2022-03-11 16:11

weixin_39430584的博客 1）安装browsermob-proxy： Browsermob-Proxy是一个开源的Java编写的基于LittleProxy的代理服务。Browsermob-Proxy的具体流程有点类似与Flidder或Charles。即开启一个端口并作为一个标准代理存在，当HTTP客户端...
python selenium+browsermob-proxy抓取请求数据示例
2024-04-28 13:39

Alice0424Xiaoq的博客 BrowserMob Proxy是一个用户操作浏览器代理的工具，它可以用于记录和分析HTTP请求和响应。主要用途之一是用于自动化测试，例如本文所写。
Python selenium+browsermobproxy获取request Header or Token
2024-06-30 01:20

zhouzhiling_的博客 Python selenium+browsermobproxy获取request Header or Token
Selenium+Browsermob-Proxy 爬虫-获取浏览器Network请求和响应（新示例）
2021-03-12 11:25

小牛牛先生的博客使用Selenium+Browsermob-Proxy 获取浏览器Network请求和响应（地址：https://blog.csdn.net/qq_32502511/article/details/101536325），发现评论里面有很多同志都说获取不到内容或者对HTTPS请求不行，今天在这里...
Python selenium Browsermob-Proxy获取网页加密请求参数的方法及过程
2022-02-26 15:48

熊河&小家的博客 Python + selenium +Browsermob-Proxy获取加密参数
python爬虫：selenium+browsermobproxy实现浏览器请求抓取（模块安装详解）
2024-08-24 18:26

EelBarb的博客为了抓取所有，通过浏览器F12可以看到的资源（静态资源和接口调用），我使用了selenium+browsermobproxy的方案来处理。这里是模块的安装方案，如需源码则关注后篇博客。
Python+Selenium+Browsermob-Proxy 爬虫-获取浏览器Network请求和响应
2019-09-27 15:05

小牛牛先生的博客但是有些时候使用Selenium仍然有一些缺陷，比如现在很多网站数据都是通过json结构的接口来交互，通过分析报文的方式直接发包可以直接拿到json数据，数据不但全而且还很好解析，这比解析html网页容易多了。...
使用python3+selenium+browsermob-proxy-2.1.4 模拟浏览器开发者模式 Network中的抓包
2021-07-12 14:38

我是个假程序员的博客首先，先安装和下载...注：先使用pip命令安装browsermob-proxy，然后根据上述地址下载二进制文件到本地，程序运行需要读取该二进制文件。 Windows使用示例： # -*- coding: utf-8 -*- # 导入相应的库 from brow
没有解决我的问题, 去提问

为什么通过selenium+browsermob-proxy获取到的请求不全呢？

4条回答 默认 最新

4条回答默认最新