闷油瓶的小拖油瓶 2021-10-29 22:05 采纳率: 100%
浏览 72
已结题

python爬虫爬取图片下载本地

这里的最后一个图片为什么下载不到本地,就最后一个图片有问题,求解

img

import requests
import urllib.request
from bs4 import BeautifulSoup
url = 'https://www.starbucks.com.cn/menu/'
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'
}
wb_data=requests.get(url=url,headers=headers)
response=urllib.request.urlopen(url)
content = response.read().decode('utf-8')

soup = BeautifulSoup(content, 'lxml')
#//url[@class="grid padded-3 product"]//strong/text()
#name_list = soup.select('ul[class="grid padded-3 product"]')
#imgs=soup.find_all('div')
imgs= soup.select('ul[class="grid padded-3 product"] div')
name_list=soup.select('ul[class="grid padded-3 product"] strong')
for i in range(len(name_list)):
        name = name_list[i]
        name1 = name.get_text()
        url=imgs[i].get("style")
        url = url[23:len(url) - 2]
        url = 'https://www.starbucks.com.cn/' + url

        print(name1)
        print(url)

        urllib.request.urlretrieve(url=url, filename='E:\软件\Pycharm_Project\loveImg\\' +name1+'.jpg')

print('---download---')

  • 写回答

2条回答 默认 最新

  • bekote 2021-10-29 22:08
    关注

    文件路径不能有斜杠

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 11月16日
  • 已采纳回答 11月8日
  • 创建了问题 10月29日

悬赏问题

  • ¥15 oracle集群安装出bug
  • ¥15 关于#python#的问题:自动化测试
  • ¥20 问题请教!vue项目关于Nginx配置nonce安全策略的问题
  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题