爬虫，正则表达式，爬取整页图片

问题遇到的现象和发生背景

学爬虫“爬取整张页面的图片数据”，跟着视频的步骤走的，但是由于视频的那个页面太老了，已经没了，就又找了一个新页面，按着视频的步骤一点点做的，但是打印出来的那个列表是个空，不知道为什么。用到了正则表达式。

用代码块功能插入代码，请勿粘贴截图

import requests
import re # 使用正则的时候要引用
if __name__ == "__main__":
    url = "https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fr=&sf=1&fmq=1461834053046_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&itg=0&ie=utf-8&word=%E5%A4%B4%E5%83%8F#z=0&pn=&ic=0&st=-1&face=0&s=0&lm=-1"
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.7 Safari/537.36'
    }
    # 使用通用爬虫对url对应的整张页面进行爬取（get请求）
    page_text = requests.get(url=url,headers=headers).text # 先以字符串形式获取，用text
    #使用聚焦爬虫将页面中所有的图片进行解析（提取）
    ex = '<div class="imgbox-border">.*?" src="(.*?)" style.*?

'
    img_src_list = re.findall(ex,page_text,re.S)# 让正则表达式作用到page_text字符串里面.findall返回一个列表，存储img_src
    print(img_src_list)

运行结果及报错内容

结果就是一个空列表，我想打印出来 img_src_list 列表里面所有的图片数据的链接

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Li&&Tao 2022-10-21 21:51
关注
很简单，你的正则写错了，双引号的个数都不配对，好不

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python如何使用正则表达式爬取京东商品信息
2020-10-15 06:10

本文主要介绍了如何使用Python编程语言和正则表达式来爬取京东商品信息。在开始爬虫之前，首先要了解目标网站京东的市场地位和商品信息的组织方式。京东是中国最大的自营式电商企业，商品信息丰富多样，因此通过正则...
用正则表达式爬取数据,网络爬虫正则表达式
2024-02-27 14:40

Fixf4556的博客大家好，本文将围绕用正则表达式爬取数据展开说明，网络爬虫正则表达式是一个很多人都想弄明白的事情，想搞清楚正则表达式爬取网页需要先了解以下几个事情。
初学python爬虫，记录一下学习过程，正则表达式提取图片网址
2020-12-23 01:14

在Python编程语言中，爬虫是一种用于自动化网络数据抓取的技术。对于初学者来说，学习如何构建一个简单的Python爬虫是十分有趣的。本篇将详细介绍如何利用正则表达式（Regular Expression）从网页中提取图片链接，以...
用正则表达式爬取古诗文网站，边玩边学
2023-05-11 10:56

过分的规定的博客本文介绍了如何使用正则表达式来爬取古诗文网站的内容。通过分析网页的 HTML 代码，我们可以找到需要爬取的内容，并使用正则表达式来匹配和提取这些内容。正则表达式是一种非常强大的工具，可以用于处理各种文本数据...
python正则表达式爬取猫眼电影top100
2020-10-18 17:21

知识点一：Python爬虫...以上知识点详细介绍了Python正则表达式爬取猫眼电影top100的相关内容，并对爬虫开发中可能遇到的关键技术点进行了说明。这些知识点对于学习Python爬虫技术，特别是正则表达式应用非常有帮助。
使用Python和正则表达式爬取网页中的URL数据
2025-02-20 16:14

不会玩技术的技术girl的博客通过Python和正则表达式，我们可以轻松实现从网页中爬取URL数据。正则表达式提供了强大的文本匹配能力，而Python的requests库和re模块则为爬虫开发提供了便利。在实际应用中，需要注意遵守法律法规和网站规则，合理...
[python爬虫] 正则表达式使用技巧及爬取个人博客实例
2017-10-18 18:15

Eastmount的博客这篇博客是自己《数据挖掘与分析》课程讲到正则表达式爬虫的相关内容，主要简单介绍Python正则表达式爬虫，同时讲述常见的正则表达式分析方法，最后通过实例爬取作者的个人博客网站。希望这篇基础文章对您有所帮助，...
Python爬虫之九：用正则表达式爬取赶集网租房信息
2021-02-09 21:55

晴朗_不积跬步无以至千里的博客一、项目分析 1、查询主页和详情页面的关系得出数据关系：每一个 class 属性为 f-list-...结论：需要查找的房源信息在 class 属性值为 js-title value title-font 的 a 标签中，因此正则表达式为： <div.+?g-list
python正则表达式爬取链家租房信息
2019-07-08 20:02

倔强 Jarrod的博客主要是使用了正则表达式爬取了{’小区名称‘，’区域‘，’户型‘，’面积‘，’价格‘}
Python爬虫基础-正则表达式！
2024-11-05 17:13

Python_trys的博客 正则表达式是对字符串的一种逻辑公式，用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则的字符串”，此字符串用来表示对字符串的一种“过滤”逻辑。正在在很多开发语言中都存在，而非python独有。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月21日

爬虫，正则表达式，爬取整页图片

问题遇到的现象和发生背景

用代码块功能插入代码，请勿粘贴截图

运行结果及报错内容

1条回答 默认 最新

问题事件

1条回答默认最新