Unjx. 2021-03-31 12:43 采纳率: 84.6%
浏览 71
已采纳

Python爬虫爬图片

import requests
import re
url='http://www.netbian.com/s/chuyinweilai/'
head={
	'user_agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
page_data=requests.get(url,headers=head).text
pattern = re.compile(r'<a href="/desk.+?<img src="(.+?)"', flags=re.S)
img_list = pattern.findall(page_data)
img_list
str=r''
print(pattern.search(str))

当我用sublime text 3运行这段代码的时候,运行没有问题,也没有报错信息,但下面显示的却是“None”,也就是没有,这就很奇怪了,我手动打开那个网站的时候明明就有图片,为什么会说none呢?难道正则表达式错了吗?应该不会吧,正则错了应该会有报错的

麻烦大佬了

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2021-03-31 13:57
    关注

    正则式没有问题,你没有用print(img_list)打印输出,后面的代码是对空值匹配,没有写对,1.加print,删去最后两行,2.把最后四行改成这样,两种改法都能输出正确结果:

    pattern = re.compile(r'<a href="/desk.+?<img src="(.+?)"', flags=re.S)
    img_list = re.findall(pattern,page_data)
    print(img_list)
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效