Python：如何读取CSV里1000个网页，然后按序存1000个网页HAR data，自动化

程序跑一次，可以去指定网页，转存一个har data文件。（这是没问题的）
但是，现在要跑1000个网页，读CSV里面的urls，但是始终无法自动命名存储下来的文档。
例如：
CSV：
1. google.com ----> 存：a1.har
2. qq.com ----->存：a2.har
3. 163.com ------> 存：a3.har..（文件名要自动生成后缀，不要覆盖了）
...如此类推 --------> 存：a1000.har

网络上，国内外的网站都找了，确实比较少关于HAR data 的存储。
个人觉得是查了一个循环的语句，让Python直到浏览器，第一个网站进去了，存好了，再去第二个网站，存好了。这样逻辑,

可是能力不够，麻烦大神帮帮忙。

import csv
from browsermobproxy import Server
from selenium import webdriver
import json
server = Server("D:\\browsermob-proxy-2.1.4\\bin\\browsermob-proxy.bat")
server.start()
proxy = server.create_proxy()

profile = webdriver.FirefoxProfile()
profile.set_proxy(proxy.selenium_proxy())
driver = webdriver.Firefox(firefox_profile=profile)

extension_dir = "C:\\Program Files (x86)\\Mozilla Firefox\\browser\\features\\"

# remember to include .xpi at the end of your file names 
extensions = [
    'adblock_plus-3.5-an+fx.xpi'
    ]

for extension in extensions:
    driver.install_addon(extension_dir + extension, temporary=True)
    proxy.new_har("qq")

path = "D:\websites.csv"    
csvfile = open(path,'r')
reader = csv.reader(csvfile)
result = {}
for item in reader:
    if reader.line_num ==1:
        continue
    result[item[0]] = item[1]

csvfile.close()
print(result)


for id, web in result.items():
    website = web
    driver.get(website)




server.stop()
driver.quit()


f = os.fdopen(fi, "w")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2019-03-23 11:30
关注
https://blog.csdn.net/u013023297/article/details/70943686

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python的异常问题解决 python
2022-05-08 16:33

回答 1 已采纳代码没错，运行方式错了，请使用以下方式运行, 假设你的python文件为main,py python3 main.py 10 需要传递一个参数用空格隔开n=int(sys.argv[1]) 这一
正则findall解析har文件，无法获取目标内容 python 爬虫
2023-02-10 13:23

回答 2 已采纳提取的文本发出来一下啊，只有开头，没有结尾怎么写？
为什么字典中items()读取字符串数据的长度不为一呢 python
2021-10-11 16:19

回答 2 已采纳 mary和clerk 这两个对应的language也要用列表形式的，不然会当作字符串处理
利用Python读取某个目录下子目录中csv进行操作并按一定目录保存
2021-02-19 20:24

坐飞机的狗的博客 # -*- coding: utf-8 -*- ...path = "F:/workspace/data" # 文件夹目录 result_file = "F:/workspace/result" # 保存结果的文件夹 def file_name(file_dir, result_file): params_path = 'C1288.
为什么通过selenium+browsermob-proxy获取到的请求不全呢？ python selenium
2020-09-15 18:04

回答 4 已采纳 from browsermobproxy import Server from selenium import webdriver from selenium.webdriver.chrome.o
这个代码要怎么改，一运行就是expected unqualified-id before '{' token。这个错误要怎么修改啊 c++ c语言
2022-05-07 14:32

回答 4 已采纳你这代码错的地方比较多，记得编码要注意编码规范，可以避免许多不必要的错误，修正后代码如下（看在辛苦帮改的份上，记得给个采纳）： #include"string.h" #define N 100 voi
蓝桥杯按键结构体数组初始化位置引起的错误 c语言 stm32 蓝桥杯
2023-03-29 14:01

回答 2 已采纳你这是典型的越界访问踩内存问题。比如int a;int b[3];int c;如果你代码中修改了b[-1]或b[3]，a或者c的值就会被修改。
C++和Python常用文件读写函数（csv）
2022-11-04 10:47

文锦渡的博客【代码】C++和Python常用文件读写函数（csv）
求助：RSA加密发送http请求失败 java
2021-06-19 20:27

回答 2 已采纳 package com.example.demo1; import javax.crypto.Cipher; import javax.crypto.NoSuchPaddingException;
执行npm install -g @vue/cli安装脚手架的时候报错 java vue.js 有问必答
2021-07-22 15:39

回答 2 已采纳你这个问题我也遇到过，应该是你node版本的问题，你可以尝试多换几个node版本，然后重新安装应该就行了。现在用的node 11.或者12.这两个个版本最好，其他的很多都会出现安装出错的问题。希望能帮
为什么我得到“无法读取未定义的属性'obj2'，而不是另一个？ ajax javascript php
2015-02-07 16:29

回答 1 已采纳 You are trying to access mink[0].obj2 when mink[0] doesn't exist. You could easily check for this
Seldom 2.0 - 让接口自动化测试更简单
2022-01-22 19:22

酔清风的博客测试数据问题：比如删除接口，重复执行还能保持结果一致，必定要做数据初始化。接口依赖问题：B 接口依赖 A 的返回值，C 接口依赖 B 接口的返回值。加密问题：不同的接口加密规则不一样。有些用到时间戳、md5、...
安装vue出现问题报错了 npm vue.js 前端
2022-09-01 10:20

回答 1 已采纳你应该已经安装过了吧，你试试输入命令vue --version看看是不是已经有了
Python自动化测试学习3
2022-10-30 12:50

九儿九知的博客命令 har2case xxx.har py文件的测试用例 har2case xxx.har -2y yaml文件的测试用例 har2case xxx.har -2j json文件的测试用例生成yaml文件 D:\PyCharm\Code\demo3\httprunner>har2case getTianqi.har -2y 生成py...
使用HttpRunner 3.x实现接口自动化测试
2021-12-22 23:50

小白典的博客 HttpRunner 是一款面向 HTTP(S) 协议的通用测试框架，只需编写维护一份YAML或JSON脚本，即可实现自动化测试、性能测试、线上监控、持续集成等多种测试需求特点继承了Requests的全部特性，可轻松实现 HTTP(S) 的...
python-httprunner自动化测试框架demo
2021-06-21 10:37

石呆呆的博客 1，录制脚本生成har文件，框架转脚本 2，参数化 3，设计用例变量可以用Config 4，debug_talk.py 写自带方法 5，步骤间应用钩子方法 .setup_hook 6，allure报告主要demo代码 1，重写了原生框架的test_start方法，...
让接口自动化测试更简单
2022-03-07 21:07

不喝枸杞的程序员的博客测试数据问题：比如删除接口，重复执行还能保持结果一致，必定要做数据初始化。接口依赖问题：B 接口依赖 A 的返回值，C 接口依赖 B 接口的返回值。加密问题：不同的接口加密规则不一样。有些用到时间戳、md5、...
大厂流出，接口测试 Seldom 2.0 - 让接口自动化测试更简单
2021-12-08 21:35

软件测试小小白的博客测试数据问题：比如删除接口，重复执行还能保持结果一致，必定要做数据初始化。接口依赖问题：B 接口依赖 A 的返回值，C 接口依赖 B 接口的返回值。加密问题：不同的接口加密规则不一样。有些用到时间戳、md5、...
python-selenium爬取页面数据
2022-10-24 15:22

风一吹你就要走的博客现在只用Selenium就可以完成 mitmproxy + Selenium 的组合才能完成的操作~~~...首先需要这个打开的浏览器是固定端口，可以通过运行一下代码来打开一个浏览器。2、python selenium 操作需要获取页面中请求的响应数据。
没有解决我的问题, 去提问

悬赏问题

¥15 树莓派与pix飞控通信
¥15 自动转发微信群信息到另外一个微信群
¥15 outlook无法配置成功
¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题

Python：如何读取CSV里1000个网页，然后按序存1000个网页HAR data，自动化

1条回答 默认 最新

悬赏问题

1条回答默认最新