在python中如何使用正则的分组,进行匹配?

使用的是python3

图片说明

我觉得应该是这个
imglist = re.findall(imgre,html)
语法不对
谁知道正确的语法是什么
哪位大神能帮改下

 import re
import urllib.request

def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html
def getImg(html):
    reg1 = r'<img src="([\s\S]*?)" data-baiduimageplus-ignore="1">'
    g0 = re.search(reg1,html).group(0)
    print(g0)
    # reg = r'src="([.*\S]*\.jpg)" pic_ext="jpeg"'
    # imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    return imglist
html = getHtml("http://huaban.com/")
html = html.decode("UTF-8")
imgList = getImg(html)

imgName = 0
for imgPath in imgList:
    f = open("pic/"+str(imgName)+".jpg","wb")
    print(imgPath)
    f.write((urllib.request.urlopen(imgPath)).read())
    f.close()
    imgName +=1
print("All done")

有了一点进展
网上有人说用search
我找了一个demo,并修改了我的代码
图片说明

但是还是报错

图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDNRGY 2017-06-23 00:34
关注
正确的做法是在循环的时候
用group
去匹配你要的数据

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python如何正则匹配空格之间的数字？ python 正则表达式
2022-04-30 01:28

回答 1 已采纳 #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: Roc-xb """ import re if __name__ == '__mai
python 如何通过正则匹配字符串后的数字 python 有问必答正则表达式
2022-06-18 11:51

回答 2 已采纳正则替换下，可以实现后面无数字，多位数字，或者为浮点数的格式 import re def getStr(s,dit): for item in dit: s=re.sub(i
python正则匹配，如何匹配出(.*)都匹配不出来的文本？ python
2020-12-11 11:47

回答 2 已采纳 re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。 print(re.search('www.g
Python使用中文正则表达式匹配指定中文字符串的方法示例
2020-10-20 14:22

在编码方面，示例中使用了`unicode(html, 'gb2312')`来进行解码操作，以便正则表达式能够匹配上字符串。这是因为请求得到的HTML内容是GB2312编码的，如果之后再转换为UTF-8，则可能无法与正则表达式中的模式匹配。 ...
请问Python正则表达式如何匹配连续的四位数字 python 有问必答
2022-04-29 12:38

回答 5 已采纳题中年份后面表示日月最多6个字符，试试如下代码： import re s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8
python 正则如何多次匹配？ python
2018-10-19 08:55

回答 5 已采纳我google了下 stackoverflow上有人问过这个问题 https://stackoverflow.com/questions/5616822/python-regex-find
Python正则表达式匹配图片 python
2021-03-28 22:00

回答 6 已采纳 1、 url='您想爬的网址' head={ 'user_agent':'需要你使用的浏览器的请求头' } page_data=requests.get(url=url,headers=h
python使用正则表达式替换匹配成功的组
2020-10-18 23:40

在Python正则表达式中，通过在模式中加上括号()来指定一个子模式，之后就可以在repl参数中使用\1, \2等来引用这些子模式。第一个括号内的匹配内容用\1表示，第二个用\2表示，依此类推。总之，Python的re模块为字符...
python爬虫，当正则表达式无法匹配，怎么输出空字符 python 有问必答正则表达式爬虫
2021-09-01 16:19

回答 3 已采纳使用try except环绕即可
python3 正则表达式怎么匹配过滤">" python 正则表达式
2021-07-19 11:54

回答 2 已采纳 re.findall(r'>(.+)',text)[0]括号提取
python中正则表达式匹配年份_在Python中使用正则表达式匹配日期？
2021-01-29 05:56

懂得越多越要学的博客这是制作正则表达式的一种方法,该表达式将匹配您所需格式的任何日期(尽管您可以明显地调整逗号是否是可选的,添加月份缩写,等等)：years = r'((?:19|20)\d\d)'pattern = r'(%%s) +(%%s), *%s' % yearsthirties = ...
详解python里使用正则表达式的分组命名方式
2020-12-25 11:36

可以通过groups()来全部访问匹配的元组，也可以通过group()函数来按分组方式来访问，但是这里只能通过数字索引来访问，如果某一天产品经理需要修改需求，让你在它们之中添加一个分组，这样一来，就会导致匹配的数组...
Python正则表达式分组概念与用法详解
2020-10-19 15:34

在Python中使用正则表达式时，分组是一个不可或缺的功能，它使得我们能够从复杂的字符串中提取出有用的信息。首先，正则表达式中的分组是通过圆括号“()”来实现的。分组可以帮助我们提取匹配模式中的某些部分。...
Python中使用正则表达式以及正则表达式匹配规则
2023-03-21 18:22

叶疏鸿的博客本文介绍了如何在Python中使用正则表达式，并介绍了常用的正则表达式匹配规则
没有解决我的问题, 去提问

悬赏问题

¥30 YOLO检测微调结果p为1
¥20 求快手直播间榜单匿名采集ID用户名简单能学会的
¥15 DS18B20内部ADC模数转换器
¥15 做个有关计算的小程序
¥15 MPI读取tif文件无法正常给各进程分配路径
¥15 如何用MATLAB实现以下三个公式（有相互嵌套）
¥30 关于#算法#的问题：运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题求各位帮我解答一下
¥15 setInterval 页面闪烁，怎么解决
¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题

在python中如何使用正则的分组,进行匹配?

2条回答 默认 最新

悬赏问题

2条回答默认最新