python正则表达式怎么提取下面所示的内容？

如图所示，这个div中间夹着的这段英文句子怎么提取出来？要剔除所有的换货和缩进。

谢谢各位

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
菜猫小六 2021-12-07 10:24
关注
原网页完全可以使用xlml之类的把字符串的源码转换为Element对象，然后用xpath之类的去解析，大概的代码应该是：

_ = etree.HTML(text) data_list = _.xpath("//div[@class='primary-head']") for data in data_list: text = data.xpath("./text()")[0].replace('\r','').replace('\n','').strip() # 这边replace，strip是去掉换行空格之类的

单单用正则，代码为：

text = re.findall("style=\"\">([\s\S]*)<\/div>",sss)[0].replace('\r','').replace('\n','').strip() print text
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 正则表达式匹配不出文字 python 正则表达式爬虫
2021-12-06 17:38

回答 1 已采纳 re.compile("需要找的字符串","这里应该是字符串的来源")
python利用正则表达式爬取网页的问题 macos python 正则表达式
2019-09-30 14:21

回答 3 已采纳 ```python3 resp = ''' 4室2厅4卫 250平南北向
使用python匹配linux命令，这种正则表达式该如何写 linux python 正则表达式
2017-05-05 03:56

回答 1 已采纳 try this ``` /more\b+[^\b]+/ /mv\b+[^\b]+/ ```
Python正则表达式匹配数字和小数的方法
2021-01-20 05:29

以上所述是小编给大家介绍的Python正则表达式匹配数字和小数的方法,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对软件开发网网站的支持！如果你觉得本文对你有...
如何使用Python中的正则表达式对特定字符串进行删除和替换 python
2022-11-17 09:02

回答 1 已采纳 #使用re模块 new_con = re.sub('(DEFINER=.*?@.*?)\s','',con)
Python的正则怎么写可以从很长的字符串中提取想要的内容并按行存入列表 python
2023-03-14 11:29

回答 4 已采纳能把str的内容贴出来吗
如何抽取TXT中的特定格式文本内容？ python 数据挖掘正则表达式自然语言处理
2020-04-08 14:54

回答 2 已采纳 ``` str1='卷之一治诸风透冰丹内容：治一切风毒……卷之一治诸风龙脑天麻煎内容：治……' import re txt1=re.findall('(.*?)(.*?)内容',str1)
python正则表达式提取文本_使用Python正则表达式操作文本数据的方法
2020-12-03 00:23

weixin_39955355的博客在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则表达式并使用它们的基础知识。您可以使用以下步骤实现正则表达式：指定模式字符串。将模式字符串编译为正则表达式对象。使用...
如何使用python针对csv文件某一列进行结尾匹配并删除 list python 正则表达式
2021-05-29 22:30

回答 1 已采纳 1 用pandas读取文件 pd.read_csv() 2 筛选 data[~((data['A列']==10)&(data['F列'].str[-5:]=='..well'))]
正则，xpath，bs4匹配 python 正则表达式
2021-09-22 15:54

回答 1 已采纳一、本质原因是Unicode在HTML中和Python中的不同表示方法以unicode e412为例在HTML中 <p> &#xe412 </p> 在python中 '\
python抓爬html网页中的所有评论 python 有问必答
2022-03-26 02:17

回答 3 已采纳直接找字符串 download_page(url,pa) 肯定没内容了，应该是找download_page函数返回值，去掉前后的双引号
Python正则表达式使用经典实例
2021-01-20 04:42

下面列出Python正则表达式的几种匹配用法，具体内容如下所示：此外,关于正则的一切http://deerchao.net/tutorials/regex/regex.htm 1.测试正则表达式是否匹配字符串的全部或部分 regex=ur #正则表达式 if re....
python正则表达式提取文本_Python正则表达式操作文本数据
2020-12-03 00:23

weixin_39775577的博客成长离不开与优秀的同伴共同交流，如果你需要好的学习环境，好的学习资源，这里欢迎每一位热爱Python的小伙伴，Python学习圈在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则...
详解Python正则表达式（含丰富案例）
2022-03-12 11:40

高成珍的博客 正则表达式在网络爬虫、数据分析中有着广泛使用，掌握正则表达式能够达到...本文详细介绍正则表达式中各种规则及其符号含义，并结合Python中的Re库进行演示，由浅入深，即学即练即用，内容丰富，非常适合初学者。
python 自动化数据提取之正则表达式
2024-04-21 09:00

自动化测试薰儿的博客 3、findall 方法参数说明：接收两个参数，第一个是匹配的规则，第二个是匹配的目标字符串，在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。注意：match 和 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月7日

悬赏问题

¥30 Matlab打开默认名称带有/的光谱数据
¥50 easyExcel模板动态单元格合并列
¥15 res.rows如何取值使用
¥15 在odoo17开发环境中，怎么实现库存管理系统，或独立模块设计与AGV小车对接？开发方面应如何设计和开发？请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
¥15 CSP算法实现EEG特征提取，哪一步错了？
¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
¥15 vue3前端取消收藏的不会引用collectId
¥15 delphi7 HMAC_SHA256方式加密
¥15 关于#qt#的问题：我想实现qcustomplot完成坐标轴
¥15 下列c语言代码为何输出了多余的空格

python正则表达式怎么提取下面所示的内容？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新