jas0nxy 2021-05-15 10:36 采纳率: 50%
浏览 237
已采纳

如何利用selenium webdriver定位网页style标签下的@规则内的内容?

我正在使用selenium webdiver的方式爬取网页,代码如下,但是无法获取到如上图所示@font-face中的内容。

from selenium import webdriver

url = 'https://jn.58.com/pinpaigongyu/44466026460292x.shtml?adtype=1&from=3-list-9&slotid=1000856&productid=10043&tid=5a5efb29-2da9-428d-9519-991a2feffa7d&extParam=%7B%22ppgy_stats%22%3A%7B%22pageSource%22%3A%22%22%2C%22resource%22%3A%2258%22%2C%22abVersion%22%3A%22%22%2C%22launchid%22%3A%22%22%7D%7D&bizresource=0'


driver = webdriver.Firefox()
driver.get(url)
font_face_scripts = driver.find_element_by_xpath('/html/head/style[1]').text
print(font_face_scripts)

请问该用什么方法获取到这一内容?谢谢!

  • 写回答

2条回答 默认 最新

  • 江天暮雪丨 2021-05-15 11:25
    关注

    我也觉得很奇怪,元素.text无法获取到style标签中的内容。只能出此下策,在driver.page_source中查找

    page_source = driver.page_source
    results = re.findall(r'<style.*?</style>', page_source)
    target_string = ''
    for result in results:
        text = result.split('>')
        if '@font-face' in text:  # 多个style.text中筛选目标
            target_string = text
            break
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 多址通信方式的抗噪声性能和系统容量对比
  • ¥15 winform的chart曲线生成时有凸起
  • ¥15 msix packaging tool打包问题
  • ¥15 finalshell节点的搭建代码和那个端口代码教程
  • ¥15 Centos / PETSc / PETGEM
  • ¥15 centos7.9 IPv6端口telnet和端口监控问题
  • ¥20 完全没有学习过GAN,看了CSDN的一篇文章,里面有代码但是完全不知道如何操作
  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 海浪数据 南海地区海况数据,波浪数据
  • ¥20 软件测试决策法疑问求解答