-小宋同学- 2019-04-07 23:57 采纳率: 100%
浏览 4193
已采纳

求助如何利用Python +selenium实现长网页截图

个人在网上搜到一个利用Chrome headless 无头浏览器截图的方法,但是截出图片为空

代码如下:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time

chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
browser = webdriver.Chrome(options = chrome_options)
browser.get('http://www,baidu.com')
time.sleep(3)
browser.get_screenshot_as_file(r'C:\Users\Desktop\pictures\12.png')

问题1:为什么以上代码运行后截图是空白的?求助
问题2:想利用Chrome Headless实现长网页的截图,该如何截图?
问题3:或者有其他方法实现长网页截图没,例如网址 https://www.so.com/s?q=%E4%BD%A0 ... 1c671edd7b6158708e6 ,若截取屏幕的话,该网页无法完全截图,想完整截图必须得滚动网页。

谢谢!

  • 写回答

3条回答 默认 最新

  • 无明之徒 2019-04-09 10:35
    关注

    https://blog.csdn.net/fnms88/article/details/82926051

    直接代码如下:
    import autoit
    import unittest
    import time
    import sys
    from datetime import datetime

    from actions import Actions
    from selenium import webdriver
    from selenium.webdriver.common.keys import Keys
    from selenium.webdriver.support.wait import WebDriverWait
    from selenium.webdriver import ActionChains
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support import expected_conditions as EC

    sys.path.append(‘D:\jftest1_CG\test1’)
    class Test_Newyyy_pctz_shfk (unittest.TestCase):
    def test_pcLogin(self):
    fp = webdriver.FirefoxProfile(r"C:\Users\mhf\AppData\Roaming\Mozilla\Firefox\Profiles\cv6txwo2.default")
    driver = webdriver.Firefox(fp)

    driver = webdriver.Firefox ()

    driver.get (“https://www.csdn.net/”)
    WebDriverWait (driver, 10).until (EC.presence_of_element_located ((By.LINK_TEXT, ‘博客’)))
    #获取浏览器窗口
    autoit.win_activate(‘CSDN-专业IT技术社区 - Mozilla Firefox’)
    print(“1111”)
    autoit.send(’{LCTRL down}’+’{LSHIFT down}’+’{! down}’)

    autoit.send(’{LCTRL down}’ + ‘{LALT down}’ + ‘{a down}’)

    driver.find_element_by_id(‘login’).send_keys(Keys.CONTROL + Keys.SHIFT + ‘!’)

    time.sleep(2)
    autoit.win_wait(‘截取的图片另存为…’)
    print(“2222”)
    autoit.control_focus(‘截取的图片另存为…’,‘1001’)
    print(“3333”)
    autoit.win_wait("[Class:#32770]",10)
    t = datetime.now().strftime(’%Y%m%d%H%M%S’)
    name=‘百度首页’+t
    autoit.control_set_text(‘截取的图片另存为…’,‘Edit1’,name)
    autoit.control_click(‘截取的图片另存为…’,‘Button2’)
    1111111
    #最后再点击一次shift键 释放长按shift ,以免后续操作不方便,点哪都觉得不好使,解铃还须系铃人(autoit)。。。
    autoit.send (’{LCTRL}’ + ‘{LSHIFT}’)
    driver.close()
    if name == ‘main’:
    unittest.main ()
    可以实现整个网页的截图
    官方的例子,也可参考:
    import autoit
    import time
    autoit.run(“notepad.exe”)
    autoit.win_wait_active("[CLASS:Notepad]", 3)
    autoit.control_send("[CLASS:Notepad]", “Edit1”, “hello world{!}”)
    autoit.win_close("[CLASS:Notepad]")
    time.sleep(100)
    autoit.control_click("[Class:#32770]", “Button2”)
    time.sleep(100)

    python的模块pywin32 可以释放按键
    import win32api
    import win32con
    win32api.keybd_event (17, 0, win32con.KEYEVENTF_KEYUP, 0) # 释放按键ctrl
    win32api.keybd_event (16, 0, win32con.KEYEVENTF_KEYUP, 0) # 释放按键shift

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 请问下这个红框里面是什么文档或者记事本编辑器
  • ¥15 机器学习教材中的例题询问
  • ¥15 求.net core 几款免费的pdf编辑器
  • ¥15 为什么安装HCL 和virtualbox之后没有找到VirtualBoxHost-OnlyNetWork?
  • ¥15 C# P/Invoke的效率问题
  • ¥20 thinkphp适配人大金仓问题
  • ¥20 Oracle替换.dbf文件后无法连接,如何解决?(相关搜索:数据库|死循环)
  • ¥15 数据库数据成问号了,前台查询正常,数据库查询是?号
  • ¥15 算法使用了tf-idf,用手肘图确定k值确定不了,第四轮廓系数又太小才有0.006088746097507285,如何解决?(相关搜索:数据处理)
  • ¥15 彩灯控制电路,会的加我QQ1482956179