想爬取一下壁纸的图片，可惜遇到错误

今天想爬一下好看的壁纸，可遇到了一些错误求帮忙

import requests
from lxml import etree
import os
url='https://wallhaven.cc/toplist?'
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.62'
}
response=requests.get(url=url,headers=headers)
page_text=response.text
tree=etree.HTML(page_text)
li_list=tree.xpath('//*[@id="thumbs"]/section[1]/ul')
if not os.path.exists('./壁纸'):
    os.mkdir('./壁纸')
for li in li_list:
    img_src='//*[@id="thumbs"]/section[1]/ul/li[2]/figure/img@src'[0]
    img_data=requests.get(url=img_src, headers=headers).content
    img_path='picLibs/' + img_src
    with open('壁纸/'+img_src)as fp:
        fp.write(img_data)
        print(img_src,'下载完成！')

url='https://wallhaven.cc/toplist?%27
报错为

就是想爬取整个排行榜的壁纸的图片，然后存到一个文件夹里面。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

坚持不懈的大白优质创作者: 前端开发技术领域 2022-01-28 20:59

关注

楼主，我把你的代码改了一下，这样就行了。

import requests
from lxml import etree
import os
import re

from torch import mode

url = 'https://wallhaven.cc/toplist?'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.62'
}
response = requests.get(url=url, headers=headers)
page_text = response.text
tree = etree.HTML(page_text)
as_href = tree.xpath('//*[@id="thumbs"]/section[1]/ul/li//a/@href')
if not os.path.exists('./壁纸'):
    os.mkdir('./壁纸')
for a_href in as_href:
    rsp = requests.get(url=a_href,headers=headers)
    html2 = etree.HTML(rsp.text)
    img_src = html2.xpath("//img[@id='wallpaper']/@src")[0]
    img_name = re.findall('.*-(.*)',img_src)[0]
    content2 = requests.get(url= img_src,headers=headers).content
    with open(file='./壁纸/{}'.format(img_name),mode='wb') as f:
        f.write(content2)

这个网站上的图片是真的不错呀！感谢楼主的分享！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

【Python实战】爬取网易云音乐用户听歌排行，来制作一张Ta最爱歌手的词云图
2020-06-21 05:55

Samaritan·J的博客如果不会编程编程，你将怎么做？一、网易云和词云想知道Ta在网易云所有时间喜爱和最爱的歌手，逻辑上讲：你可以基于Ta的所有时间听歌排行，手动记录他排行中前100首听得最多的歌曲的歌手/音乐人（以下统称
系统编程学习笔记
2021-08-18 13:20

Mona______的博客】 1、用来获取上一个命令的退出状态 2、获取函数的返回值对于shell函数来说，return关键字用来表示函数的退出状态，而不是函数的返回值，shell与其他语言不同，他没有处理返回值的关键字 D. history 查看历史命令 ...
Go 爬虫之 colly 从入门到不放弃指南
2022-04-01 08:20

Seekload的博客刚看到它的时候，我总会情不自禁想借鉴我的 scrapy 使用经验，但结果发现这种生搬硬套并不可行。到此，我们自然地想到去找些文章阅读，但结果是 colly 相关文章确实有点少，能找到的基本都是官方提供的，而且看起来...
再见北理工：忆北京研究生的编程时光
2016-09-13 17:26

Eastmount的博客郭神博客：guolin的博客_CSDN博客-Android疑难解析,Android精华教程,随笔领域博主然后你可以去Github或开源网站学习比较新的Android知识，或一些框架，比如图片瀑布流显示，大量图片访问，下拉菜单刷新图片，这些...
AI生成播客脚本：从选题到成稿的全流程解析
2025-07-05 23:37

程序员光剑的博客想象一下：你想做一档美食播客，但盯着空白文档两小时，选题还没定；好不容易确定主题，写脚本又花了三天，结果录出来发现逻辑混乱、听众不爱听。这是不是很多播客创作者的日常？本文的目的，就是教你如何用AI当...
一线数据分析师教你如何写简历才能脱颖而出！
2021-02-04 08:46

赵小洛的博客发现一些朋友虽然工作好几年，但是并不太懂得如何用简历包装自己，非常可惜的错过机会。授人以鱼不如授人以渔，今天我将非常宝贵的经验分享给大家，希望可以对数分人有所帮助。本篇内容极度干货，请收藏食用。 01 ...
写好分析报告，思路最重要
2021-08-05 08:18

IT农民工1的博客所以在写报告的时候，我们会很想把这些意料之外的信息也加到报告里，不然会觉得太可惜了。但是这样会导致整个报告的内容不聚焦，读者会被这些零散的观点带偏，搞不清要说的到底是什么。有些做法更加过分。我见过...
描述现状类的分析该怎么做
2020-11-26 08:18

IT农民工1的博客如果没有那么清楚，只是简单地想要做个活动提升一下销量。那么就可以用第一类标准。严谨的逻辑是数据分析师的基础按照这种结构描述现状，也有可能会出现业务方不认可的情况。比如你用同比，业务方认为去年同期有...
爬虫教程（ 6 ） --- 爬虫进阶、扩展
2022-07-11 07:35

「已注销」的博客因为爬虫程序通常需要做的事情如下： 1)给定的种子 URLs，爬虫程序将所有种子 URL 页面爬取下来 2)爬虫程序解析爬取到的 URL 页面中的链接，将这些链接放入待爬取 URL 集合中 3)重复 1、2 步，直到达到指定条件才...
并发编程面试题（2020最新版）
2020-03-30 23:20

wangzhipeng47的博客并发编程面试题（2020最新版）原创ThinkWon最后发布于2020-03-14 17:28:01阅读数 14536收藏分类专栏：Java面试总结版权声明：本文为博主原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接和本...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月28日

想爬取一下壁纸的图片，可惜遇到错误

1条回答 默认 最新

问题事件

1条回答默认最新