爬虫数据解析的时候出现的问题？

在做爬虫的时候本来打算用正则节选出来的图片
但是最后节选出来的是【】
代码如下

import requests
import re
p_url = "https://mmbiz.qpic.cn/mmbiz_jpg/aMVBs00R3EpUGSsB62EkEcrG1IbztbvfZb2ibaSiaJFXwWTC38f1Esw43ynZAmvzag79QJ1dqQ6aRkyicRZM3UK6A/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1"
zz = '<img.*?src="(.*?)"'
p_headers = {
      'User Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.61 Safari/537.36'
}
page_data = requests.get(url = p_url, headers = p_headers).text
image_list = re.findall(zz, page_data, re.S)
print(image_list)
print("爬取结束")

print出来一个[]
试着想看是不是requests.get那边的问题然后试着print page_data结果解码不出来
但我想解码不出来是不是有部分是汉字的原因那是不是表示这部分也没问题
然后就停止思考了》。。
请求大家的帮助按理说会打印很多图片地址的吧

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ash062 2022-12-28 15:23
关注
为什么解码不了，因为返回的是一张图片。。。
可以加上这两行看一下

res = requests.get(url = p_url, headers = p_headers) with open('.\\640.jpg', 'wb') as f: f.write(res.content)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

爬虫数据解析的时候出现的问题？ python 爬虫
2022-12-28 14:44

回答 2 已采纳为什么解码不了，因为返回的是一张图片。。。可以加上这两行看一下 res = requests.get(url = p_url, headers = p_headers) with open('.\\6
python后端开发或爬虫怎么系统学习？ python 后端爬虫
2023-04-13 13:18

回答 1 已采纳爬虫严格来讲并不算一个大方向，更偏向于js逆向，python的话推荐走后端方向至于系统学习的话，推荐去blibili找一些路线，然后根据路线去找bilibili上播放量比较高的视频进行系统学习
python爬虫网页解析页码遍历时出现问题爬虫
2022-04-23 22:42

回答 1 已采纳这样写 div = ..... if not div: div = ...
慢病爬虫数据管理后端.zip
2024-01-19 17:02

爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL...
Python爬虫只解析了一部分网页？ python 爬虫
2021-11-19 14:39

回答 1 已采纳第一个问题，你用html.xpath('//div[@class="co_content8"]/ul/table')找不到，是因为在table那一类，有很多分支标签，所以定位不到具体的元素。第二个问题
关于python爬虫的问题，如何解决？ python 爬虫
2022-09-24 14:13

回答 1 已采纳可以看下python参考手册中的 python- 接下来？
python爬虫请求数据加密怎么破解？？？ python
2021-03-04 22:33

回答 3 已采纳页面地址 http://tool.liumingye.cn/music/?page=searchPage 脚本里有个encode函数，是这么加密的。如果要爬取的话用selenium比较适
一个管理磁力和漫画爬虫的springboot项目（kb磁力后端）.zip
2024-03-08 12:17

如果您下载了本程序，但是该程序存在问题无法运行，那么您可以选择退款或者寻求我们的帮助（如果找我们帮助的话，是需要追加额外费用的）。另外，您不会使用资源的话（这种情况不支持退款），也可以找我们帮助（需要...
爬虫爬取数据出现编码问题 python 爬虫
2021-08-10 11:17

回答 1 已采纳自行解决了只需要把这个编码换成utf-8就可以了
python爬虫数据显示问题 python 爬虫
2022-07-20 16:54

回答 3 已采纳首先，你这里写错了divs = query(".cm-content-box").items()
scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
关于爬虫解析数据的4种方式
2021-11-22 11:08

米兔-miny的博客爬虫之解析数据的4种方式：XPath解析数据、BeautifulSoup解析数据、正则表达式、pyquery解析数据。
python 爬虫 js解析数据没问题 py中execjs 报错 javascript python
2023-03-08 13:26

回答 3 已采纳他还引用了另一个包，你一起弄进来
以Node.js基于express以及爬虫实现的视频资源后端.zip
2024-03-25 17:19

爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL...
仿『小黑盒』安卓APP，含后端、界面原型、爬虫.zip
2024-03-06 11:33

爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月28日

悬赏问题

¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测
¥88 python部署量化回测异常问题
¥30 酬劳2w元求合作写文章
¥15 在现有系统基础上增加功能
¥15 远程桌面文档内容复制粘贴，格式会变化
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码
¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”

爬虫数据解析的时候出现的问题？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新