爬虫数据解析的时候出现的问题？

在做爬虫的时候本来打算用正则节选出来的图片
但是最后节选出来的是【】
代码如下

import requests
import re
p_url = "https://mmbiz.qpic.cn/mmbiz_jpg/aMVBs00R3EpUGSsB62EkEcrG1IbztbvfZb2ibaSiaJFXwWTC38f1Esw43ynZAmvzag79QJ1dqQ6aRkyicRZM3UK6A/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1"
zz = '<img.*?src="(.*?)"'
p_headers = {
      'User Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.61 Safari/537.36'
}
page_data = requests.get(url = p_url, headers = p_headers).text
image_list = re.findall(zz, page_data, re.S)
print(image_list)
print("爬取结束")

print出来一个[]
试着想看是不是requests.get那边的问题然后试着print page_data结果解码不出来
但我想解码不出来是不是有部分是汉字的原因那是不是表示这部分也没问题
然后就停止思考了》。。
请求大家的帮助按理说会打印很多图片地址的吧

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ash062 2022-12-28 15:23
关注
为什么解码不了，因为返回的是一张图片。。。
可以加上这两行看一下

res = requests.get(url = p_url, headers = p_headers) with open('.\\640.jpg', 'wb') as f: f.write(res.content)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

慢病爬虫数据管理后端.zip
2024-01-19 17:02

爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL...
一个管理磁力和漫画爬虫的springboot项目（kb磁力后端）.zip
2024-03-08 12:17

如果您下载了本程序，但是该程序存在问题无法运行，那么您可以选择退款或者寻求我们的帮助（如果找我们帮助的话，是需要追加额外费用的）。另外，您不会使用资源的话（这种情况不支持退款），也可以找我们帮助（需要...
关于爬虫解析数据的4种方式
2021-11-22 11:08

米兔-miny的博客爬虫之解析数据的4种方式：XPath解析数据、BeautifulSoup解析数据、正则表达式、pyquery解析数据。
【计算机科学】基于Python的网络爬虫技术分析：网页数据采集与处理方法研究
2026-01-07 17:29

文章重点阐述了使用Python语言实现网络爬虫的核心技术，包括网页请求、数据解析、信息提取与存储等关键步骤，并对常用的Python库如Requests、BeautifulSoup、Scrapy等进行了对比分析。同时，报告还探讨了反爬机制的...
基于Python的ECommerce网站数据爬虫设计源码
2024-10-05 16:40

这些脚本可能包含网络请求处理、数据解析、数据存储等功能模块，每一个模块都经过精心设计，以适应不同的抓取需求和提高数据抓取的效率和质量。在视觉元素方面，项目提供了75个GIF图片和10个JPG图片文件，以及10个...
运行爬虫时可能遇到哪些常见问题？
2025-01-10 10:25

数据小爬虫@的博客通过上述解决方案，可以有效地解决Python爬虫在开发和应用中遇到的各种问题，提高爬虫的稳定性和效率。
【基于网络爬虫】基于Python的技术原理与应用：数据采集系统设计及反爬策略研究
2026-01-13 08:45

随后阐述了爬虫的工作机制，包括HTTP请求与响应、网页解析、数据存储以及应对反爬虫策略的技术手段。文中还详细介绍了Requests、BeautifulSoup、Scrapy和Selenium等常用Python库和框架的功能与特点。最后探讨了网络...
以Node.js基于express以及爬虫实现的视频资源后端.zip
2024-03-25 17:19

爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL...
爬虫采集行业数据_java_爬虫_数据分析_
2021-10-01 02:46

【标题】：“爬虫采集行业数据_java_爬虫_数据分析_”揭示了这个主题的核心是使用Java编程语言来实现网络爬虫技术，从而获取并分析特定行业的数据。爬虫是自动化抓取网页信息的程序，它能高效地从互联网上收集大量...
爬虫之数据解析----JSON
2024-10-05 02:46

薛定谔的小笼包·的博客 JSON是一种轻量级的...同时也方便了机器进行解析和生成。适用于进行数据交互的场景，比如网站前台与后台之间的数据交互。前端（JS,HTML,CSS) →JSON → 后端（python）后端（python） → JSON → 前端（JS,HTML,CSS)
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月28日

爬虫数据解析的时候出现的问题？

2条回答 默认 最新

问题事件

2条回答默认最新