Python：如何读取CSV里1000个网页，然后按序存1000个网页HAR data，自动化

程序跑一次，可以去指定网页，转存一个har data文件。（这是没问题的）
但是，现在要跑1000个网页，读CSV里面的urls，但是始终无法自动命名存储下来的文档。
例如：
CSV：
1. google.com ----> 存：a1.har
2. qq.com ----->存：a2.har
3. 163.com ------> 存：a3.har..（文件名要自动生成后缀，不要覆盖了）
...如此类推 --------> 存：a1000.har

网络上，国内外的网站都找了，确实比较少关于HAR data 的存储。
个人觉得是查了一个循环的语句，让Python直到浏览器，第一个网站进去了，存好了，再去第二个网站，存好了。这样逻辑,

可是能力不够，麻烦大神帮帮忙。

import csv
from browsermobproxy import Server
from selenium import webdriver
import json
server = Server("D:\\browsermob-proxy-2.1.4\\bin\\browsermob-proxy.bat")
server.start()
proxy = server.create_proxy()

profile = webdriver.FirefoxProfile()
profile.set_proxy(proxy.selenium_proxy())
driver = webdriver.Firefox(firefox_profile=profile)

extension_dir = "C:\\Program Files (x86)\\Mozilla Firefox\\browser\\features\\"

# remember to include .xpi at the end of your file names 
extensions = [
    'adblock_plus-3.5-an+fx.xpi'
    ]

for extension in extensions:
    driver.install_addon(extension_dir + extension, temporary=True)
    proxy.new_har("qq")

path = "D:\websites.csv"    
csvfile = open(path,'r')
reader = csv.reader(csvfile)
result = {}
for item in reader:
    if reader.line_num ==1:
        continue
    result[item[0]] = item[1]

csvfile.close()
print(result)


for id, web in result.items():
    website = web
    driver.get(website)




server.stop()
driver.quit()


f = os.fdopen(fi, "w")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2019-03-23 11:30
关注
https://blog.csdn.net/u013023297/article/details/70943686

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

利用Python读取某个目录下子目录中csv进行操作并按一定目录保存
2021-02-19 20:24

坐飞机的狗的博客 # -*- coding: utf-8 -*- ...path = "F:/workspace/data" # 文件夹目录 result_file = "F:/workspace/result" # 保存结果的文件夹 def file_name(file_dir, result_file): params_path = 'C1288.
Python从0到100（九十）：UCI-HAR数据集深度剖析和训练仿真（文末送书）
2025-03-04 09:31

是Dream呀的博客本文系统性地阐述了从数据预处理到深度神经网络建模的全流程解决方案，以UCI-HAR数据集为研究对象，通过Python实现多维时间序列信号的智能解析，融合了信号处理技术与卷积神经网络（CNN），构建了端到端的人类活动...
C++和Python常用文件读写函数（csv）
2022-11-04 10:47

文锦渡的博客【代码】C++和Python常用文件读写函数（csv）
Python爬虫（37）Python爬虫深度实践：Splash渲染引擎与BrowserMob Proxy网络监控协同作战
2025-05-23 10:20

一个天蝎座白勺程序猿的博客在Web 3.0技术浪潮下，数据采集领域面临前端架构极客化、反爬技术军事化和规模需求指数化三大技术革命。传统爬虫系统在渲染性能、网络监控和反爬对抗方面存在显著瓶颈。为解决这些问题，文章深入剖析了Splash渲染...
【Python】已解决：json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
2024-09-11 20:55

屿小夏的博客这通常发生在从文件或网络请求中读取JSON数据时，尤其是在处理API响应或文件输入时。该错误表明在尝试解析JSON数据时，解析器在输入的第一个字符处就未能找到有效的JSON数据。为了解决该报错问题，我们可以添加必要...
Python爬虫【三十七章】爬虫深度实践：Splash渲染引擎与BrowserMob Proxy网络监控协同作战
2025-07-16 11:15

程序员_CLUB的博客架构创新：首创混合渲染+网络监控协同架构，响应时间缩短66%性能飞跃：Docker化后资源利用率提升58%，并发能力提升300%监控突破：实现全协议网络监控，覆盖率达98%运维革命：实现分钟级集群扩容，故障自愈时间缩短至...
python2 csv-Python数据分析基础——读写CSV文件2
2020-11-11 15:13

weixin_39982580的博客 2.2筛选特定的行：行中的值满足某个条件行中的值属于某个集合行中的值匹配于某个模式.../usr/bin/env python32 importcsv3 importsys45 input_file = sys.argv[1]6 output_file = sys.argv[2]78 with open(input_fil...
Seldom 2.0 - 让接口自动化测试更简单
2022-01-22 19:22

酔清风的博客测试数据问题：比如删除接口，重复执行还能保持结果一致，必定要做数据初始化。接口依赖问题：B 接口依赖 A 的返回值，C 接口依赖 B 接口的返回值。加密问题：不同的接口加密规则不一样。有些用到时间戳、md5、...
Python自动化测试学习3
2022-10-30 12:50

九儿九知的博客命令 har2case xxx.har py文件的测试用例 har2case xxx.har -2y yaml文件的测试用例 har2case xxx.har -2j json文件的测试用例生成yaml文件 D:\PyCharm\Code\demo3\httprunner>har2case getTianqi.har -2y 生成py...
时间序列分类20：数据可视化与问题分析建模流程详解（UCI-HAR）
2020-04-12 12:42

EAI2的博客 UCI人类活动识别数据集是人类活动识别领域的benchmark数据集（还有一个常用的特征维数和活动种类更多的OPPORTUNITY数据集，会在之后的文章中介绍），本文详细介绍了UCI-HAR数据集，并通过该数据集来探索加载数据集...
python-httprunner自动化测试框架demo
2021-06-21 10:37

石呆呆的博客 1，录制脚本生成har文件，框架转脚本 2，参数化 3，设计用例变量可以用Config 4，debug_talk.py 写自带方法 5，步骤间应用钩子方法 .setup_hook 6，allure报告主要demo代码 1，重写了原生框架的test_start方法，...
让接口自动化测试更简单
2022-03-07 21:07

不喝枸杞的程序员的博客测试数据问题：比如删除接口，重复执行还能保持结果一致，必定要做数据初始化。接口依赖问题：B 接口依赖 A 的返回值，C 接口依赖 B 接口的返回值。加密问题：不同的接口加密规则不一样。有些用到时间戳、md5、...
SqlMap 入门：他倾尽所有，只为在她的技术星河 “占个位”
2024-12-17 00:22

慕云LL的博客 SqlMap 是一款开源的自动化 SQL 注入工具，用 Python 语言编写。它主要用于检测和利用 Web 应用程序中的 SQL 注入漏洞。SQL 注入是一种常见的网络安全漏洞，攻击者通过在用户输入或其他可输入的地方注入恶意 SQL ...
【测试】接口测试与接口自动化
2024-10-05 07:39

简单.is.good的博客原因： ①、去除冗余代码 ②、实现请求统一管理，如统一异常管理、统一日志管理、接口自动化测试引入pytest用例管理框架 python：pytest，unitest java: testng，junit pytest作用： 1、找到用例模块名必须以test_...
使用HttpRunner 3.x实现接口自动化测试
2021-12-22 23:50

小白典的博客 HttpRunner 是一款面向 HTTP(S) 协议的通用测试框架，只需编写维护一份YAML或JSON脚本，即可实现自动化测试、性能测试、线上监控、持续集成等多种测试需求特点继承了Requests的全部特性，可轻松实现 HTTP(S) 的...
接口自动化框架封装思想建立（全）
2024-06-06 22:28

阿金￥的博客 env：存放环境变量.gitignore 当你的项目...接口定义层（api）：为了更好的管理接口描述，每个一个接口定义都应该尽量的能够单独运行。2.测试用例层（testcases）3.测试套件层（testsuites）关系：testcases调用api层。
没有解决我的问题, 去提问

Python：如何读取CSV里1000个网页，然后按序存1000个网页HAR data，自动化

1条回答 默认 最新

1条回答默认最新