python re提取网页内容，代码怎么写


# noinspection PyUnresolvedReferences
from bs4 import BeautifulSoup
# noinspection PyUnresolvedReferences
from lxml import etree
import requests


html = "https://zhidao.baidu.com/question/2207469534762529468.html"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.67'
}
h = requests.get(html,headers=headers)
h.encoding = 'gbk'
print(h.text)

提取这个内容

写回答
好问题 1 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
鸡蛋酱$ 2021-07-23 06:30
关注
要看你的网页的源代码的结构是什么

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

编辑

预览

报告相同问题？

关注问题

Python Re 正则表达式数据匹配提取基本使用
2022-10-05 12:12

EXI-小洲的博客 Python Re 正则表达式数据匹配提取基本使用
使用Python提取中文的实战代码
2023-10-01 23:30

爱编程的喵喵的博客本文主要介绍了使用Python提取中文的实战代码，希望能对学习python的同学们有所帮助。文章目录 1. 问题描述 2. 实战代码 2.1 提取中文的实战代码 2.2 删除中文的实战代码
Python使用re模块正则提取字符串中括号内的内容示例
2020-12-25 02:54

本文实例讲述了Python使用re模块正则提取字符串中括号内的内容操作。分享给大家供大家参考，具体如下：直接上代码吧： # -*- coding:utf-8 -*- #! python2 import re string = 'abe(ac)ad)' p1 = re.compile(r'[(]...
python提取日志内容_Python正则提取日志内容
2020-12-08 13:13

weixin_39628186的博客 true 320 等需要提取cs_item_sk 以1结尾的并且最后是true的值代码如下 import re string = r'cs_item_sk[\s=]*(\d*?1+)\s+.+?true\s*(\d+)$' # string = r'cs_item_sk' pattern = re.compile(string) with open('...
使用 Python3 获取网页源代码
2022-12-23 13:57

大秦重工的博客爬虫的数据爬取量非常大，显然不可能对每个页面都手动复制源代码，因此就有必要使用自动化的方式来获取网页源代码。
python+re正则表达式提取中文(工作笔记需要自取)
2024-06-17 01:00

一晌小贪欢的博客 python+re正则表达式提取中文(工作笔记需要自取)
python正则表达式提取网页内容_Python使用正则表达式获取网页中所需要的信息
2020-11-29 16:40

weixin_39560245的博客使用正则表达式的几个步骤：1、用import re 导入正则表达式模块；2、用re.compile()函数创建一个Regex对象；3、用Regex对象的search()或findall()方法，传入想要查找的字符串，返回一个Match对象；4、调用Match对象...
python如何获取网页内容_python如何获取网页内容
2021-01-14 18:38

富一代周胖胖的博客 python如何获取网页内容发布时间：2020-09-21 15:15:32来源：亿速云阅读：62作者：小新这篇文章主要介绍了python如何获取网页内容，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。...
如何用Python获取网页指定内容
2021-11-11 02:32

liver100day的博客如何用Python获取网页指定内容文章目录如何用Python获取网页指定内容1.抓取网页源代码2.抓取一个网页源代码中的某标签内容3.抓取多个网页子标签的内容 Python用做数据处理还是相当不错的，如果你想要做爬虫，Python...
Python如何使用正则表达式提取网页中的特定信息？
2024-10-27 06:10

InnoLink_1024的博客例如，如果要提取网页中的所有电子邮件地址，电子邮件地址的一般格式是用户名@域名，可以编写如下正则表达式模式：[a - zA - Z0 - 9_.±]+@[a - zA - Z0 - 9 -]+.[a - zA - Z0 - 9 -]+。：在使用*、+等量词时，默认...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请详细说明问题背景 7月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月23日

python re提取网页内容，代码怎么写

5条回答 默认 最新

问题事件

5条回答默认最新