幽梦飘凌 2023-02-16 20:04 采纳率: 100%
浏览 24
已结题

如何用css提取标题

如何用css提取标题?
试过#wrapper #content h1:: text无法提取出“肖申克救赎”,且返回的是空白

img

  • 写回答

2条回答 默认 最新

  • CodeBytes 2023-02-16 20:57
    关注

    该回答引用ChatGPT
    在 Python 中使用 CSS 提取文本需要借助第三方库,比如 BeautifulSoup。下面是一个示例代码,假设要从 HTML 中提取

    标签中的文本:

    
    from bs4 import BeautifulSoup
    import requests
    
    # 发送请求,获取 HTML 内容
    response = requests.get('http://example.com')
    html = response.content
    
    # 使用 BeautifulSoup 解析 HTML
    soup = BeautifulSoup(html, 'html.parser')
    
    # 提取 <h1> 标签的文本
    h1_text = soup.select_one('h1').text
    print(h1_text)
    
    

    这段代码使用 requests 库向指定的 URL 发送请求,获取 HTML 内容。然后使用 BeautifulSoup 解析 HTML,soup.select_one('h1') 返回第一个

    标签对象,text 属性返回标签中的文本内容。

    需要注意的是,CSS 选择器中的空格 表示嵌套关系,比如 #wrapper #content h1 表示 id="wrapper" 的元素下,id="content" 的元素下,

    标签。如果要选择文档中的某个元素,不需要加空格,比如 h1 表示所有的

    标签。如果使用了嵌套选择器,需要确保 HTML 文档中的对应元素结构与选择器规则一致。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月4日
  • 已采纳回答 2月24日
  • 创建了问题 2月16日

悬赏问题

  • ¥15 付费求做一个自助抢单插件
  • ¥15 bat批处理,关于数据复制问题
  • ¥50 同步两个不同结果的array中某些属性
  • ¥15 悬赏15远程操控解决问题
  • ¥15 CST复制的模型无法单独修改参数?
  • ¥15 前端页面想做个定时任务,但是使用requestAnimationFrame,setinterval和settimeout都不行
  • ¥15 根据以下文字信息,做EA模型图
  • ¥15 删除虚拟显示器驱动 删除所有 Xorg 配置文件 删除显示器缓存文件 重启系统 可是依旧无法退出虚拟显示器
  • ¥15 vscode程序一直报同样的错,如何解决?
  • ¥15 关于使用unity中遇到的问题