#_*_coding:骆驼翔子-8_*_ 2023-07-16 11:51 采纳率: 93.3%
浏览 18
已结题

python webdriver如何获取网页html


from selenium import webdriver
from time import sleep

driver = webdriver.Chrome("D:/chromedriver/chromedriver.exe")
driver.get("https://www.douyin.com/video/7253737735683329338")
sleep(2)
html = driver.page_source

print(html)

这是用webdriver获取的网页源代码,请问如何获取被渲染后的代码?就是这个部分

img

  • 写回答

2条回答 默认 最新

  • 竹山全栈 2023-07-16 12:21
    关注

    很多种方法,beautifulsoup或者xpath,都有调用案例的,

    
    from selenium import webdriver
    from bs4 import BeautifulSoup
    from time import sleep
    
    # 设置driver路径
    driver = webdriver.Chrome("D:/chromedriver/chromedriver.exe")
    
    # 打开网页
    driver.get("https://www.douyin.com/video/7253737735683329338")
    # 等待页面加载
    sleep(2)
    
    # 获取页面源代码
    html = driver.page_source
    
    # 使用BeautifulSoup解析页面
    soup = BeautifulSoup(html, 'html.parser')
    
    # 查找video标签
    video_tags = soup.find_all('video')
    
    # 遍历video标签并打印内容
    for video in video_tags:
        print(video)
    
    # 关闭浏览器
    driver.quit()
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月24日
  • 已采纳回答 7月16日
  • 创建了问题 7月16日

悬赏问题

  • ¥300 寻抓云闪付tn组成网页付款链接
  • ¥15 请问Ubuntu要怎么安装chrome呀?
  • ¥15 视频编码 十六进制问题
  • ¥15 Xsheii7我安装这个文件的时候跳出来另一个文件已锁定文件的无一部分进程无法访问。这个该怎么解决
  • ¥15 unity terrain打包后地形错位,跟建筑不在同一个位置,怎么办
  • ¥15 FileNotFoundError 解决方案
  • ¥15 uniapp实现如下图的图表功能
  • ¥15 u-subsection如何修改相邻两个节点样式
  • ¥30 vs2010开发 WFP(windows filtering platform)
  • ¥15 服务端控制goose报文控制块的发布问题