python + selenium+Chrome，在headless 模式下使用 save as pdf 将网页另存为PDF文件失败。

问题遇到的现象和发生背景

因故，需要将1000多人的某种信息在某平台上进行查询，然后打印出来。
想法是用python + selenium+Chrome，另存为PDF。在非headless状态下勉强运作（涉及另外两个问题放后面），
主要问题：headless模式下，save as PDF好像根本不工作，没有生成PDF文件。
次要问题：1、在检查网页元素是否生存的情况下，还会时不时因为元素没生成而出错。
2、采用先保存PDF后重命名的方式批量保存，经常因找不到下载好的PDF文件无法rename。但文件事实上已经下载好了。原因判断不来。

问题相关代码，请勿粘贴截图

import 省略
#warnings.filterwarnings('ignore')
wb = load_workbook('C:/Users/Administrator/Desktop/2#.xlsx') #要查询的列表 
ws1 = wb['Sheet1']
ws2 = wb['Sheet2']
sn=ws1['A'] #序号
name=ws1['B'] #姓名 
pid=ws1['E'] #编号之类的
i=0
while i < ws1.max_row :

    print(sn[i].value,name[i].value,pid[i].value)#看进度
    filepatch='C:/Users/Administrator/Desktop/查询结果/' #保存PDF文件的地方
    appState = {
            "recentDestinations": [
                {
                    "id": "Save as PDF",
                    "origin": "local",
                    "account":"",
                }
            ],
            "selectedDestinationId": "Save as PDF",
            "version": 2
        }
    profile = {
        'printing.print_preview_sticky_settings.appState': json.dumps(appState),
        'savefile.default_directory': filepatch
    }
    chrome_options = webdriver.ChromeOptions()
    chrome_options.add_experimental_option('prefs', profile)
    chrome_options.add_argument('--kiosk-printing')
    chrome_options.add_argument('--enable-print-browser')
   # chrome_options.add_argument('--headless') #目前headless模式下不会存PDF
    chrome_options.add_argument('--disable-gpu')
    chrome_options.add_argument('--no-sandbox')
    
    
    newname=str(sn[i].value) +str(name[i].value) + '.pdf'
    
    browser = webdriver.Chrome("chromedriver.exe",options=chrome_options)
    url = 'https://*****inquire.html' #隐私保护，在这里*掉，请见谅。
    browser.get(url)
    browser.maximize_window()
    browser.implicitly_wait(5)
    browser.find_element_by_id('personName').send_keys(name[i].value)
    browser.find_element_by_id('personIdcard').send_keys(pid[i].value)
    browser.find_element_by_id('submitBtn').click()
    button = browser.find_element_by_xpath('//*[@id="verify-wrap"]/span[1]')
    action = ActionChains(browser)
    #滑动验证后点一个“查看”按钮，显示更多结果。
    action.click_and_hold(button).perform()
    action.move_by_offset(browser.find_element_by_xpath('//*[@id="verify-wrap"]/span[2]').size.get('width'), 0).perform()
    action.release().perform()
    #下面两行不是很理解 ，估计是第一行逻辑有问题，导致“查看”结果时，时不时出错。
    WebDriverWait(browser,10,0.5).until(expected_conditions.element_to_be_clickable(browser.find_element_by_xpath('//*[@id="lookBtn"]')))
    WebDriverWait(browser,10,0.5).until(expected_conditions.element_to_be_clickable((By.XPATH,'//*[@id="lookBtn"]')))
    browser.find_element_by_xpath('//*[@id="lookBtn"]').click()

    temp_title = browser.title
    newname=str(sn[i].value) +str(name[i].value) + '.pdf'  #filepatch+
    browser.execute_script('document.title='+'"'+ newname + '"' +';')

    browser.execute_script('return window.print();')
    #time.sleep(5)
    #采用先保存PDF后改名的方式，时不时提示“找不到文件”，猜测OS.renames的时候，PDF文件还没存好，难道是异步执行的原因？？但查询相关资料，browser.execute_script却是同步的，不理解相关机制，不好判断。
    #os.renames(filepatch + temp_title + '.pdf', filepatch+str(sn[i].value) +str(name[i].value) + '.pdf')

    #os.system("pause")
    browser.close()
    i=i+1

运行结果及报错内容

主要问题：headless模式下根本没有生成PDF文件。显式模式下，会在指定的目录下生成PDF文件。

我的解答思路和尝试过的方法

网外有讨论过类似问题，大意是：Chrome headless模式下会忽略save as pdf参数块设置的保存位置，而默认保存在Chrome 的程序目录，而高版本Chrome 的默认目录又禁止headless模式下载文件。

我想要达到的结果

headless 模式下正常地将网页另存为PDF文件。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-黄老师 2022-01-22 13:53
关注
这个正常的，无头模式会对一些自动化操作无效，这个是selenium自身问题

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python+selenium+xpath如何定位网页table表格中的数据 python selenium 有问必答爬虫
2022-02-25 12:44

回答 2 已采纳使用last()定位最后一个tr节点，再用索引获取。示例： from lxml import etree with open('a.html','r',encoding='utf-8') as f:
python+selenium 断言怎么判断 python selenium
2021-07-15 16:19

回答 2 已采纳就是判断下弹出框中的某些元素存不存在是吧？参考下：https://www.cnblogs.com/yoyoketang/p/6493005.html
求助如何利用Python +selenium实现长网页截图 python
2019-04-07 23:57

回答 3 已采纳 https://blog.csdn.net/fnms88/article/details/82926051 直接代码如下： import autoit import unittest im
python chrome headless_通过googlechrome在headless mod中下载文件
2021-03-04 09:43

山蓝蓝的博客 Selenium client version: Selenium v3.141.59Chrome version: Chrome v77.0ChromeDriver version: ChromeDriver v77.0要下载文件，请单击this website中文本为下载数据的元素，您可以使用以下解决方案：代码块：...
python+selenium，想问下，为啥输出为empty suite呀 python selenium
2023-03-08 09:13

回答 2 已采纳 1、怎么执行的代码？使用单元测试框架么？但是你的类、函数的定义都不符合单元测试框架的定义规则：py文件名、类名、函数名使用test命名2、close函数中代码也是有问题的，self.open()函数没
python+selenium中findelement怎么会报错 python selenium 测试工具
2022-12-17 14:33

回答 1 已采纳相关的包（有的人称为库）没有导入导入By模块 from selenium.webdriver.common.by import Byfrom selenium import webdriverchr
python3+selenium如何获取页面的加载时间或者时间戳 python selenium 测试工具
2022-05-23 09:55

回答 1 已采纳 from datetime import datetime ##获取页面加载时间 a = datetime.now() url='http://192.168.1.199/' x=webdrive
selenium调用浏览器打印功能，并保存为PDF
2022-04-24 16:19

一目知之的博客在使用selenium处理浏览器功能时，无法正常检测到或无法定位到你想处理的功能。而浏览器的启动参数可以帮我们实现很多功能。点击查看——Chrome浏览器启动命令行参数大全功能详情代码如下（示例）： # -*- ...
python+selenium运行时报错 python selenium
2022-08-14 00:03

回答 6 已采纳是不是你定位节点错了，selenium找不到相应节点，我运行起来没反应导入from selenium.webdriver.chrome.service import Service可解决报错
python+selenium+js 模拟点击问题 python selenium 数据挖掘有问必答
2021-04-13 08:54

回答 3 已采纳在browserdriver.execute_script('$arguments[0]).click()',btn) 的[0]后面多了个括号。改成：browserdriver.execute_scr
Python + Selenium 截图问题 python selenium
2023-04-19 12:15

回答 2 已采纳您可以使用 execute_script 方法来模拟滚动操作，将页面滚动到下一屏数据的位置，然后再进行截图。循环执行这个过程，直至页面所有数据都被截取到为止。下面是一个简单的示例代码： from se
python使用selenium以及selenium-wire做质量与性能检测
2022-08-04 14:49

飞鸟真人的博客 selenium以及selenium-wire做质量与性能检测
python+selenium，使用HTMLTestRunner跑的测试报告里报错了，为啥这样？ python selenium 有问必答
2021-06-21 23:58

回答 2 已采纳找到问题的原因了，是因为我在testcase里chromedriver的路径为相对路径，testcase里我写的是： self.driver = webdriver.Chrome(‘..\..\dr
【Python实用技能】建议收藏：自动化实现网页内容转PDF并保存的方法探索（含代码，亲测可用）
2024-03-16 07:00

同学小张的博客本文将探索自动化把URL列表所对应的网页打印成PDF文件的实现方法，内含完整代码，可直接运行使用，建议收藏备用。
用Python实现办公自动化（自动化处理PDF文件）
2024-03-28 16:17

syblogs的博客 “Python程序代码”"""为PDF文件添加水印，防止他人随意盗用"""# 导入pathlib模块中的Path()函数,用于完成路径相关操作# 使用Python第三方模块PyPDF2来操控PDF文件.PdfReader类用于读取PDF文件，PdfWriter类用于输出...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月22日

悬赏问题

¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集

python + selenium+Chrome，在headless 模式下 使用 save as pdf 将网页另存为PDF文件失败。