jas0nxy 2021-05-15 10:36 采纳率: 50%
浏览 237
已采纳

如何利用selenium webdriver定位网页style标签下的@规则内的内容?

我正在使用selenium webdiver的方式爬取网页,代码如下,但是无法获取到如上图所示@font-face中的内容。

from selenium import webdriver

url = 'https://jn.58.com/pinpaigongyu/44466026460292x.shtml?adtype=1&from=3-list-9&slotid=1000856&productid=10043&tid=5a5efb29-2da9-428d-9519-991a2feffa7d&extParam=%7B%22ppgy_stats%22%3A%7B%22pageSource%22%3A%22%22%2C%22resource%22%3A%2258%22%2C%22abVersion%22%3A%22%22%2C%22launchid%22%3A%22%22%7D%7D&bizresource=0'


driver = webdriver.Firefox()
driver.get(url)
font_face_scripts = driver.find_element_by_xpath('/html/head/style[1]').text
print(font_face_scripts)

请问该用什么方法获取到这一内容?谢谢!

  • 写回答

2条回答 默认 最新

  • 江天暮雪丨 2021-05-15 11:25
    关注

    我也觉得很奇怪,元素.text无法获取到style标签中的内容。只能出此下策,在driver.page_source中查找

    page_source = driver.page_source
    results = re.findall(r'<style.*?</style>', page_source)
    target_string = ''
    for result in results:
        text = result.split('>')
        if '@font-face' in text:  # 多个style.text中筛选目标
            target_string = text
            break
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?