正则表达式的相关事情

我在学习爬虫的时候遇到需要从一段话中提取出图片网址的需求。

待提取文字：

t1 = """
<div class="thumb"><a href="/article/123954862" target="_blank">
<img src="//pic.qiushibaike.com/system/pictures/12395/123954862/medium/L62DIHT1AV2DKIUV.jpg" alt="糗事#123954862" class="illustration" width="100%" height="auto">
</a>
</div>
"""

正则：

ex = '<div class="thumb">.*?<img src="(.*?)" alt=.*?</div>'

然后在一些正则网站中无法识别

但是在Python的re模块中使用语句就可以识别：

t1 = """
<div class="thumb"><a href="/article/123954862" target="_blank">
<img src="//pic.qiushibaike.com/system/pictures/12395/123954862/medium/L62DIHT1AV2DKIUV.jpg" alt="糗事#123954862" class="illustration" width="100%" height="auto">
</a>
</div>
"""
ex = '<div class="thumb">.*?<img src="(.*?)" alt=.*?</div>'
img_src_list = re.findall(ex,t1,re.S)

就可以提取到呢？是不是因为换行符号的原因

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Dawn_www 2021-01-09 00:25
关注
"."匹配除换行符 \n 之外的任何单字符，所以你在正则表达式的网址上无法提取。你在python里提取的到是因为re.S使 . 匹配包括换行在内的所有字符

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

python 正则表达式判断_Python 正则表达式
2021-03-05 15:59

吃月亮的人的博客 )(0*)$', '102300').groups() ('1023', '00') 编译当我们在Python中使用正则表达式时，re模块内部会干两件事情：编译正则表达式，如果正则表达式的字符串本身不合法，会报错；用编译后的正则表达式去匹配字符串。...
python正则表达式代码_Python 正则表达式
2021-03-06 15:00

阿银爱吃甜食桑的博客任何一种编程语言中，虽然并不总会遇到使用正则表达式的情况，但是，如果一旦到了需要用的场合却不会用，着实会陷入一个困境，所以，正则表达式是一个必要掌握的知识模块。正则表达式(regular expression)描述了一种...
正则表达式详解（Python）
2022-07-25 19:35

散一世繁华，颠半世琉璃的博客 Python编程：正则表达式详解
python中文正则表达式详解_Python匹配中文的正则表达式
2021-02-03 11:24

绝代小李的博客 Python 分享正则表达式匹配中文例：书名1【精装版】书名2【豪华版版】 (.*?)[【|小编知道，忘记是件轻松的事情，只要不看着，不想着，不记着，就忘记了，就像，烟火过后的天空。Python用正则表达式匹配含有中文的...
python使用正则表达式代码_python如何使用正则表达式
2021-02-09 22:34

weixin_39895684的博客 正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则，凡是符合规则的字符串，我们就认为它“匹配”了，否则，该字符串就是不合法的。所以我...
python正则表达式或者用法_python正则表达式用法
2020-12-19 11:46

weixin_39719732的博客 ur"" #正则表达式ifre.search(regex,subject):do_something()else:do_anotherthing()上例中，在regex输入我们的正则表达式，然后用来在subject中匹配，根据匹配结果做不同的事情2.测试正则表达式是否匹配整个字符串...
python正则表达式数字开头_Python正则表达式总结
2020-12-17 11:00

weixin_39715997的博客编译当我们在Python中使用正则表达式时，re模块内部会干两件事情： 1.编译正则表达式，如果正则表达式的字符串本身不合法，会报错； 2.用编译后的正则表达式去匹配字符串。如果一个正则表达式要重复使用几千次，...
python怎么通过正则表达式获取路径
2024-08-16 09:03

这件事情足够自信的博客我整理的一些关于【Python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/Hpqqk2使用Python的正则表达式获取文件路径在处理文件和路径时，Python 提供了强大的库和工具来帮助程序员...
Python练习题目，正则表达式练习
2024-07-31 17:37

zhjx0903的博客 Python正则表达式练习，相对简单；实现与strip()一样的效果。
PYTHON-使用正则表达式进行模式匹配
2024-02-22 15:22

疯狂的码泰君的博客简单介绍一下Python的正则表达式
没有解决我的问题, 去提问

正则表达式的相关事情

5条回答 默认 最新

5条回答默认最新