re.compile提取网页信息

#片名链接
<img src="https://img3.doubanio.com/f/sns/5741f726dfb46d89eb500ed038833582c9c9dcdb/pics/sns/doulist/ic_play_web@2x.png" style="width: 16px; vertical-align: text-top;"/>
        肖申克的救赎 The Shawshank Redemption
      </a>

#图片链接
<img src="https://img2.doubanio.com/view/photo/s_ratio_poster/public/p480747492.jpg"/>

#提取片名
？？？

#提取图片
#findImgSrc = re.compile(r'<img src = (.*?)>')

正在学习python爬虫知识,前些阵子写代码遇到一些问题,想爬豆瓣上的电影信息,目前图片和片名的提取方式可能有误,用findall得到的数据输出全是[],不知道该咋办了,图片前两行是原网页的信息，”提取片名“目前不知道怎么写了，“提取图片”那里错误也不知道在哪，希望有大佬来解惑,十分感谢！！！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
coagenth 2021-04-11 23:42
关注
s ='''<img src="https://img3.doubanio.com/f/sns/5741f726dfb46d89eb500ed038833582c9c9dcdb/pics/sns/doulist/ic_play_web@2x.png" style="width: 16px; vertical-align: text-top;"/> 肖申克的救赎 The Shawshank Redemption </a>''' import re img=re.findall(r'<img src=\"(.*?)\"',s) name=re.findall(r'<img.*/>\s+(.*?)\s+</a>',s) print(img) print(name)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何解决re. compile只匹配一次的问题？ python
2021-10-07 08:42

回答 1 已采纳用findall查找即可匹配所有结果
如何通过python提取word里面的选择题和填空题 python
2022-05-21 16:01

回答 1 已采纳报错信息是什么
Python 的re为什么匹配不到？正则表达式没错呀 python 爬虫
2022-04-06 23:40

回答 1 已采纳你打印下result1，得出来的不是个列表啊，finditer匹配还没用过，看这个得到的是个对象，不能直接循环它，可以考虑用用findall
python re re.compile search groupdict 正则多取值
2022-07-04 00:38

marc_chen的博客 python re re.compile search groupdict 正则多取值
Python获取div下内容 python 爬虫
2022-04-14 10:52

回答 1 已采纳一个取巧的方法： # span后面的懒得写了。。正则表达式的前后缀你可以改动一下 list_match = re.findall(r'<span...>(.*?)</span>
求解，该如何用bs或者re提取以下特定内容？ python
2021-08-09 12:24

回答 2 已采纳使用正则：player.updateSrc([\s\S]?(src:.?),[\s\S]*?); v1=re.search(r'player.updateSrc\([\s\S]*?(src:.*?),
python爬虫代码运行输出结果不完整 pycharm python 爬虫
2021-11-20 01:32

回答 1 已采纳不知道你解决了没，我就简单说一下我的解决方法。 obj3 = re.compile(r'<div id="Zoom">.*?◎片　　名(?P<movie>.*?)<br
提取出包含关键词的句子，使用 re.compile() 函数，python
2022-12-18 19:01

Shen Planck的博客为了提取包含关键词的句子，你可以使用 Python 的正则表达式库 re 中的 re.compile() 函数。首先，你需要安装 re 库： pipinstall re 然后，你可以使用 re.compile() 函数创建一个正则表达式对象，该对象可以用来...
python 如何通过正则匹配字符串后的数字 python 有问必答正则表达式
2022-06-18 11:51

回答 2 已采纳正则替换下，可以实现后面无数字，多位数字，或者为浮点数的格式 import re def getStr(s,dit): for item in dit: s=re.sub(i
python正则表达式匹配中文字符后面手机号码问题 python 正则表达式
2022-11-15 00:42

回答 2 已采纳你这里使用了^字符，这个表示从字符开头开始匹配，所以开头不是1[3-9]的都匹配不上
Python爬虫正则表达式 python
2022-07-22 09:38

回答 3 已采纳
Python 之正则表达re.compile()与re.findall()详解
2022-04-03 14:50

蜡笔小头子的博客在使用爬虫提取网页中的部分信息时，采用到了re.compile()与re.findall()两种方法，目的：把网页中的“某某城市土地规划表”截取并打印出来. 网页中的代码： <span class='tab-details'>某某城市土地规划...
python爬虫 SVG映射反爬虫绕过需求 python 有问必答爬虫
2021-12-26 13:02

回答 2 已采纳题主要的代码如下 import re import requests from parsel import Selector from lxml import etree def getCssNumb
pythonrecompile中变量_python re模块中的 re.compile 函数
2021-01-29 02:16

池幼的博客 import rere.compile(pattern [, flags])该函数将某个包含正则表达式的字符串创建为模式对象，使用re.compile()函数进行转换后，re.search(pattern, string)的调用方式就转换为 pattern.search(string)的调用方式，...
python re compile无法获取_python3 re.compile()处理选项时需要注意什么？
2020-12-10 08:52

weixin_39555951的博客之前小编还在说各位小伙伴们学习python的出错类型各种各样，轮到小编自己传文章的时候，都忘记了点击已审核，浪费了一小部分文章跟大家见面的时间，好在影响不是很大，小编很快就发现了这个疏忽。那么，我们最近在...
【从零学习python 】64. Python正则表达式中re.compile方法的使用详解
2023-08-22 15:57

全栈若城的博客本文详细介绍了Python正则表达式中的re.compile方法，该方法可以生成一个正则表达式对象，并用于实现字符串匹配操作。文章通过示例代码演示了re.compile方法的使用方式，并说明了其在提高匹配效率、代码可读性和维护...
Python的正则表达式re模块的compile()方法有什么作用？
2023-07-31 17:26

昊虹AI笔记的博客 Django的re模块的compile()方法有什么作用？
详解python之re.split()、re.search()、re.match()
2022-06-20 13:16

赵孝正的博客详解python之re.split()
没有解决我的问题, 去提问

悬赏问题

¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)
¥15 Vue3地图和异步函数使用
¥15 C++ yoloV5改写遇到的问题
¥20 win11修改中文用户名路径
¥15 win2012磁盘空间不足,c盘正常，d盘无法写入
¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
¥15 帮我写一个c++工程
¥30 Eclipse官网打不开，官网首页进不去，显示无法访问此页面，求解决方法
¥15 关于smbclient 库的使用

re.compile提取网页信息

1条回答 默认 最新

悬赏问题

1条回答默认最新