问题遇到的现象和发生背景
学爬虫“爬取整张页面的图片数据”,跟着视频的步骤走的,但是由于视频的那个页面太老了,已经没了,就又找了一个新页面,按着视频的步骤一点点做的,但是打印出来的那个列表是个空,不知道为什么。用到了正则表达式。
用代码块功能插入代码,请勿粘贴截图
import requests
import re # 使用正则的时候要引用
if __name__ == "__main__":
url = "https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fr=&sf=1&fmq=1461834053046_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&itg=0&ie=utf-8&word=%E5%A4%B4%E5%83%8F#z=0&pn=&ic=0&st=-1&face=0&s=0&lm=-1"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.7 Safari/537.36'
}
# 使用通用爬虫对url对应的整张页面进行爬取(get请求)
page_text = requests.get(url=url,headers=headers).text # 先以字符串形式获取,用text
#使用聚焦爬虫将页面中所有的图片进行解析(提取)
ex = '<div class="imgbox-border">.*?" src="(.*?)" style.*?
运行结果及报错内容
结果就是一个空列表,我想打印出来 img_src_list 列表里面所有的图片数据的链接