Unjx. 2021-03-28 14:00 采纳率: 84.6%
浏览 101
已采纳

Python正则表达式匹配图片

1 import requests
2 import re
3  #line3~line6应该填补一些什么代码?
4  #我想这里几行应该是提供网页吧?
5  #相当于告诉是正则表达式要在哪个网页里匹配图片(jpg,png,gif)
6  
7 pattern=re.compile(r" #这里填匹配图片(jpg,png,gif)的正则表达式 ")
8 str=r''
9 print(pattern.search(str))

如上,我的想法是我指定一个网页,然后通过正则表达式匹配出我想要的

我的问题:

1.如何指定网页?

2.匹配图片的正则表达式有哪些?(我这段代码能用的)

  • 写回答

6条回答 默认 最新

  • 木三136 2021-03-29 01:46
    关注

    1、

    url='您想爬的网址'
    head={
        'user_agent':'需要你使用的浏览器的请求头'
    }
    page_data=requests.get(url=url,headers=head).text #获得页面的html代码

    2、
    具体的正则表达式 应该 是需要看具体的html代码来进行编写 ,如果有模板的话请告诉我一下

    您可以参考这个来写您需要的

    ex='<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
    Unjx. 2021-03-29 13:53

  • #**** #****
  • 这里的“#****”都是我自己替换上去的(防止泄密)应该不影响您吧?还请大佬赐本白一个表达式

    回复
    Unjx. 回复 Unjx. 2021-03-29 13:56
    回复
    Unjx. 2021-03-29 14:02

    初来乍到不会用,看评论

    回复
查看更多回答(5条)
编辑
预览

报告相同问题?

问题事件

  • 已采纳回答 7月18日

悬赏问题

  • ¥15 编译python程序为pyd文件报错:{"source code string cannot contain null bytes"
  • ¥20 关于#r语言#的问题:广义加行模型拟合曲线后如何求拐点
  • ¥15 fluent设置了自动保存后,会有几个时间点不保存
  • ¥20 激光照射到四象线探测器,通过液晶屏显示X、Y值
  • ¥15 这怎么做,怎么在我的思路下改下我这写的不对
  • ¥50 数据库开发问题求解答
  • ¥15 安装anaconda时报错
  • ¥15 小程序有个导出到插件方式,我是在分包下引入的插件,这个export的路径对吗,我看官方文档上写的是相对路径
  • ¥20 希望有人能帮我完成这个设计( *ˊᵕˋ)
  • ¥100 将Intptr传入SetHdevmode()将Intptr传入后转换为DEVMODE的值与外部代码不一致
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部