python正则表达式怎么提取下面所示的内容？

如图所示，这个div中间夹着的这段英文句子怎么提取出来？要剔除所有的换货和缩进。

谢谢各位

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
菜猫小六 2021-12-07 10:24
关注
原网页完全可以使用xlml之类的把字符串的源码转换为Element对象，然后用xpath之类的去解析，大概的代码应该是：

_ = etree.HTML(text) data_list = _.xpath("//div[@class='primary-head']") for data in data_list: text = data.xpath("./text()")[0].replace('\r','').replace('\n','').strip() # 这边replace，strip是去掉换行空格之类的

单单用正则，代码为：

text = re.findall("style=\"\">([\s\S]*)<\/div>",sss)[0].replace('\r','').replace('\n','').strip() print text
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python正则表达式怎么提取下面所示的内容？ python 正则表达式爬虫
2021-12-07 08:48

回答 1 已采纳原网页完全可以使用xlml之类的把字符串的源码转换为Element对象，然后用xpath之类的去解析，大概的代码应该是： _ = etree.HTML(text) data_list = _.xpat
python 正则表达式匹配不出文字 python 正则表达式爬虫
2021-12-06 17:38

回答 1 已采纳 re.compile("需要找的字符串","这里应该是字符串的来源")
python利用正则表达式爬取网页的问题 macos python 正则表达式
2019-09-30 14:21

回答 3 已采纳 ```python3 resp = ''' 4室2厅4卫 250平南北向
Python正则表达式匹配数字和小数的方法
2021-01-20 05:29

以上所述是小编给大家介绍的Python正则表达式匹配数字和小数的方法,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对软件开发网网站的支持！如果你觉得本文对你有...
使用python匹配linux命令，这种正则表达式该如何写 linux python 正则表达式
2017-05-05 03:56

回答 1 已采纳 try this ``` /more\b+[^\b]+/ /mv\b+[^\b]+/ ```
如何使用Python中的正则表达式对特定字符串进行删除和替换 python
2022-11-17 09:02

回答 1 已采纳 #使用re模块 new_con = re.sub('(DEFINER=.*?@.*?)\s','',con)
正则，xpath，bs4匹配 python 正则表达式
2021-09-22 15:54

回答 1 已采纳一、本质原因是Unicode在HTML中和Python中的不同表示方法以unicode e412为例在HTML中 <p> &#xe412 </p> 在python中 '\
python正则表达式提取文本_使用Python正则表达式操作文本数据的方法
2020-12-03 00:23

weixin_39955355的博客在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则表达式并使用它们的基础知识。您可以使用以下步骤实现正则表达式：指定模式字符串。将模式字符串编译为正则表达式对象。使用...
Python的正则怎么写可以从很长的字符串中提取想要的内容并按行存入列表 python
2023-03-14 11:29

回答 4 已采纳能把str的内容贴出来吗
如何抽取TXT中的特定格式文本内容？ python 数据挖掘正则表达式自然语言处理
2020-04-08 14:54

回答 2 已采纳 ``` str1='卷之一治诸风透冰丹内容：治一切风毒……卷之一治诸风龙脑天麻煎内容：治……' import re txt1=re.findall('(.*?)(.*?)内容',str1)
如何使用python针对csv文件某一列进行结尾匹配并删除 list python 正则表达式
2021-05-29 22:30

回答 1 已采纳 1 用pandas读取文件 pd.read_csv() 2 筛选 data[~((data['A列']==10)&(data['F列'].str[-5:]=='..well'))]
Python正则表达式使用经典实例
2021-01-20 04:42

下面列出Python正则表达式的几种匹配用法，具体内容如下所示：此外,关于正则的一切http://deerchao.net/tutorials/regex/regex.htm 1.测试正则表达式是否匹配字符串的全部或部分 regex=ur #正则表达式 if re....
python抓爬html网页中的所有评论 python 有问必答
2022-03-26 02:17

回答 3 已采纳直接找字符串 download_page(url,pa) 肯定没内容了，应该是找download_page函数返回值，去掉前后的双引号
python正则表达式提取文本_Python正则表达式操作文本数据
2020-12-03 00:23

weixin_39775577的博客成长离不开与优秀的同伴共同交流，如果你需要好的学习环境，好的学习资源，这里欢迎每一位热爱Python的小伙伴，Python学习圈在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则...
详解Python正则表达式（含丰富案例）
2022-03-12 11:40

高成珍的博客 正则表达式在网络爬虫、数据分析中有着广泛使用，掌握正则表达式能够达到...本文详细介绍正则表达式中各种规则及其符号含义，并结合Python中的Re库进行演示，由浅入深，即学即练即用，内容丰富，非常适合初学者。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月7日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效

python正则表达式怎么提取下面所示的内容？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新