python re提取网页内容，代码怎么写


# noinspection PyUnresolvedReferences
from bs4 import BeautifulSoup
# noinspection PyUnresolvedReferences
from lxml import etree
import requests


html = "https://zhidao.baidu.com/question/2207469534762529468.html"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.67'
}
h = requests.get(html,headers=headers)
h.encoding = 'gbk'
print(h.text)

提取这个内容

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
鸡蛋酱$ 2021-07-23 14:30
关注
要看你的网页的源代码的结构是什么

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

python re提取网页内容，代码怎么写 python
2021-07-23 14:21

回答 5 已采纳要看你的网页的源代码的结构是什么
Python re.findall怎么提取两个含符号的字符段中间的内容 python
2021-03-19 23:18

回答 6 已采纳 import re txt =''' <td class="abcde:0:no_22" style="white;"><center>需要提取的内容1</cente
python 提取cmd窗口中冒号之后的内容 python 有问必答正则表达式
2022-03-24 09:17

回答 4 已采纳 IPv4 = re.findall('(?<=IPv4 地址 . . . . . . . . . . . . : ).*', result.read())
Python使用re模块正则提取字符串中括号内的内容示例
2020-09-20 10:27

主要介绍了Python使用re模块正则提取字符串中括号内的内容,结合实例形式分析了Python使用re模块进行针对括号内容的正则匹配操作,并简单解释了相关修正符与正则语句的用法,需要的朋友可以参考下
python使用re模块提取列表中对应字段 list python
2020-04-24 00:01

回答 2 已采纳你最好多给出几个样例，以便区分不同的数据就你的来说，这么写就可以。 ``` # -*- coding: UTF-8 -*- import re list=["\r\r\n 双流市场设备
Python获取div下内容 python 爬虫
2022-04-14 10:52

回答 1 已采纳一个取巧的方法： # span后面的懒得写了。。正则表达式的前后缀你可以改动一下 list_match = re.findall(r'<span...>(.*?)</span>
Python从给定字符串中提取单词 python
2022-05-31 21:07

回答 3 已采纳注：str dict 都是内置函数，尽量不要用它们作变量名。 zen = """The Zen of Python, by Tim Peters Beautiful is
Python Re 正则表达式数据匹配提取基本使用
2022-10-05 20:12

EXI-小洲的博客 Python Re 正则表达式数据匹配提取基本使用
如何通过python提取word里面的选择题和填空题 python
2022-05-21 16:01

回答 1 已采纳报错信息是什么
python 正则提取 (年) 月日 python 正则表达式
2023-01-08 13:08

回答 2 已采纳 text = "2022年1月2日 1月3日" data = re.findall("\d{4}年\d{1,2}月\d{1,2}日|\d{1,2}月\d{1,2}日", text) print(da
python re.findall方法截取字符串中某个字符后面的数字 python
2018-09-12 06:18

回答 2 已采纳通过眼力观察我看你写的没有问题，你可以换一个字符串试试，也知道你中间是不是出什么问题了，你这样写必须除数字外全匹配，中间出个什么错误或不一致，就蛋疼了，也可以用 a=re.findall(r'.
python 根据正则表达式提取指定的内容实例详解
2021-01-20 05:13

python 根据正则表达式提取指定的内容正则表达式是极其强大的，利用正则表达式来提取想要的内容是很方便的事。下面演示了在python里，通过正则表达式来提取符合要求的内容。实例代码： import re # 正则...
Python re.findall怎么模糊多个词语然后匹配后获取到句子中的内容 python
2021-03-23 00:02

回答 4 已采纳 import re text = ''' <td class="abcde:0:WW_11" style=";"><center>占位这是关键
python提取日志内容_Python正则提取日志内容
2020-12-08 21:13

weixin_39628186的博客 true 320 等需要提取cs_item_sk 以1结尾的并且最后是true的值代码如下 import re string = r'cs_item_sk[\s=]*(\d*?1+)\s+.+?true\s*(\d+)$' # string = r'cs_item_sk' pattern = re.compile(string) with open('...
使用 Python3 获取网页源代码
2022-12-23 21:57

猿小猴子的博客爬虫的数据爬取量非常大，显然不可能对每个页面都手动复制源代码，因此就有必要使用自动化的方式来获取网页源代码。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请详细说明问题背景 7月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月23日

悬赏问题

¥15 c语言怎么用printf（“\b \b”）与getch（）实现黑框里写入与删除？
¥20 怎么用dlib库的算法识别小麦病虫害
¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
¥15 java写代码遇到问题，求帮助
¥15 uniapp uview http 如何实现统一的请求异常信息提示？
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？

python re提取网页内容，代码怎么写

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新