zhangpeinan123 2023-07-04 08:47 采纳率: 66.7%
浏览 52
已结题

关于爬虫的问题,如何解决?

我写了一个爬虫来爬取壁纸,但是下载的全都是空白文件,最重要的是在别人的电脑上运行是正常的,源码也只是文件路径被改了一下,这是什么原因(解释器用的是pychart)

import requests
from lxml import etree
from urllib import request

u = 'https://www.10wallpaper.com/cn/list/mysterious_universe-space_hd_desktop_wallpapers.html'
result = requests.get(u)
data = etree.HTML(result.content)
d = data.xpath('//img')
for i in d:
    newurl = i.xpath('./@src')[0]
    newname = i.xpath('./@alt')[0]
    newname = str(newname)
    newurl = 'https://www.10wallpaper.com' + str(newurl)
    #print(newurl)
    request.urlretrieve(newurl, r'D:\pictures\\' + newname + '.jpg')
    print('<%s>下载完毕'%newname)

img

img

  • 写回答

2条回答 默认 最新

  • winx96 2023-07-04 10:02
    关注

    输出的文件不对

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月12日
  • 已采纳回答 7月4日
  • 创建了问题 7月4日