Python爬虫爬图片

import requests
import re
url='http://www.netbian.com/s/chuyinweilai/'
head={
	'user_agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
page_data=requests.get(url,headers=head).text
pattern = re.compile(r'<a href="/desk.+?<img src="(.+?)"', flags=re.S)
img_list = pattern.findall(page_data)
img_list
str=r''
print(pattern.search(str))

当我用sublime text 3运行这段代码的时候，运行没有问题，也没有报错信息，但下面显示的却是“None”,也就是没有，这就很奇怪了，我手动打开那个网站的时候明明就有图片，为什么会说none呢？难道正则表达式错了吗？应该不会吧，正则错了应该会有报错的

麻烦大佬了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-03-31 13:57
关注
正则式没有问题，你没有用print(img_list)打印输出，后面的代码是对空值匹配，没有写对，1.加print，删去最后两行，2.把最后四行改成这样，两种改法都能输出正确结果：

pattern = re.compile(r'<a href="/desk.+?<img src="(.+?)"', flags=re.S) img_list = re.findall(pattern,page_data) print(img_list)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬虫爬图片 python 爬虫
2022-10-12 14:43

回答 4 已采纳
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫的图片爬取 python 爬虫
2021-08-30 12:26

回答 2 已采纳按照下图这样就可以了
python爬虫20个案例
2018-03-25 07:34

讲诉python爬虫的20个案例。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
Python爬虫下载图片 python
2021-04-01 22:12

回答 2 已采纳
python爬虫网页图片 python 爬虫
2022-08-04 20:03

回答 2 已采纳你把这里的文件名改成绝对路径加文件名呢你没加路径，保存到的是你运行代码的那个路径里面去了你把那个盘符和文件夹名给加上
Python爬虫爬图片 python
2021-03-31 12:43

回答 2 已采纳正则式没有问题，你没有用print(img_list)打印输出，后面的代码是对空值匹配，没有写对，1.加print，删去最后两行，2.把最后四行改成这样，两种改法都能输出正确结果： pattern
基于python爬虫的中国疫情数据可视化分析
2022-04-24 15:32

包含了所有的源代码，本项目是一个练手的爬虫小案例。
python爬虫数据显示问题 python 爬虫
2022-07-20 16:54

回答 3 已采纳首先，你这里写错了divs = query(".cm-content-box").items()
python3.10爬虫爬图片，显示访问超时 python 爬虫
2021-12-26 23:32

回答 1 已采纳 1.请求头里面换user-agent2.使用动态ip这个是我都爬虫专栏，我会不定期更新https://blog.csdn.net/qq_62932195/category_11495999.html?
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
81个Python爬虫源代码
2018-12-13 14:23

81个Python爬虫源代码，内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源
关于python爬虫，图片反爬 html python 爬虫
2022-07-12 00:50

回答 2 已采纳不是你爬到的是个静态的html页但是人家的html页其实是动态的，是需要执行js然后修改上面的值的
Python爬虫系列（一）——手把手教你写Python爬虫
2021-10-23 15:47

纸照片的博客适合初学者快速上手入门，以爬取CSDN和百度图片为例。
python爬虫爬取网页图片
2022-12-22 18:05

chenruhan_QAQ_的博客 python爬虫爬取网页上的图片
没有解决我的问题, 去提问

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效

Python爬虫爬图片

2条回答 默认 最新

悬赏问题

2条回答默认最新