爬取商品图片，alt中名字相同，执行后只有一张图，把改为src后就报错，

import requests
import os
from lxml import etree
if __name__ == "__main__":

    # 爬取页面源码数据
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }   # UA伪装
    url = 'https://item.jd.com/100021007440.html'
    page_text = requests.get(url=url,headers = headers).text
    # 手动设定响应数据的编码格式
    # res = requests.get(url=url,headers = headers)
    # res.encoding = 'utf-8'
    # page_text = res.text

    # 页面数据解析
    tree = etree.HTML(page_text)
    # 创建一个文件夹
    if not os.path.exists('./jd_img'):
        os.mkdir('./jd_img')
    li_list = tree.xpath('//*[@id="spec-list"]//li')
    for li in li_list:
        #局部解析 获取src 与 alt
        img_src = li.xpath('./img/@src')[0]
        img_name = li.xpath('./img/@src')[0]+'.jpg'
        # 通用处理中文乱码的解析方式
        # img_name = img_name.encode('iso-8859-1').decode('gbk')

        url = 'http:'+img_src

        # 爬取图片数据content
        pic_content = requests.get(url= url,headers = headers).content

        #持久化存储
        img_path = 'jd_img/' + img_name
        fp = open(img_path,'wb')
        fp.write(pic_content)
        print(img_name,'下载成功')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-06-19 10:39
关注
改成src后，图片名称这样写，img_name=img_src.split('/')[-1]，代码中的写法有误。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬取图片报错TypeError python 爬虫
2022-12-29 23:52

回答 1 已采纳你这是没有爬到，数据为空的才报的错。可以使用异常处理try一下，再处理为空的情况
求助：python爬取图片，怎么取出标签里的src内容？ python
2020-09-01 20:40

回答 6 已采纳源码中有包含所有图片url的json对象 ![图片说明](https://img-ask.csdn.net/upload/202009/03/1599063207_992984.jpg) 因此可以
用JS修改图片src时为什么会报错，求解答 javascript 有问必答
2022-01-16 16:13

回答 1 已采纳 var img = document.getElementsByClassName("img")[0]; //获取img标签===>改下面这个，getElementsByClassName是通过
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一...答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，这门语言入门挺简单的，特别是对于那些有其他编程语言经验的人。
python爬虫爬取斗图啦上的图片，打开爬取的图片显示图片错误 python
2019-08-03 11:41

回答 3 已采纳已经解决，data-origina属性是一个网址，所以在这里要再requests.get(data).content这样才是图片内容。图片应该以二进制方式储存，所以应该以wb模式写入
在Python中xpath爬图片src有问题 python
2022-09-27 00:17

回答 5 已采纳 import urllib.request from lxml import etree def create_request(page): if (page == 1):
想爬取SHEIN的女裙的图片、标题、价格与颜色，但总是报错 python 有问必答
2021-05-16 13:22

回答 3 已采纳一般是页面没有全部被加载，然后程序已经被读取了。或者这个标签根本不存在。 import requests import bs4 import time import random import p
怎么用python爬图片_(Python爬虫爬取图片这个报错怎么处理？)
2020-11-24 05:35

weixin_39837867的博客想想Python爬一些风景图片，能否有人一步步教我把想爬的网站给我，我爬好把教程写给你Python爬虫爬取图片这个报错怎么处理？你好！你的错误在于html页面img标签src属性中的链接，可能是因为src中的url格这样的：这样...
为什么python爬取下来的json格式的数据解析后不能用列表推导式输出数据? python 有问必答
2021-06-10 15:32

回答 3 已采纳 title = [i['title'] for i in data['data']['list']]
Python爬取图片问题 python
2021-04-07 06:15

回答 2 已采纳题主存在问题是：保存图片路径是写死的，循环中会一直覆盖写入"python爬虫图片实验2.jpg"这张图片，所以最后只能得到一张图片修改：保存图片路径需要改一下，让每一次循环时，图片写入不
为什么python报错但是能运行出一部分正确结果呢？ python
2021-07-27 17:34

回答 1 已采纳 import requests from lxml import etree if __name__ == '__main__': url='http://www.netbian.com/
Python爬取读书网的图片链接和书名并保存在数据库中
2023-10-31 21:48

Big-Peng的博客这个爬虫项目应该可以适用于挺多场景的，不是特别多，跟着写一下也没啥坏处。如果有代码的需求的话，日后会把项目的代码地址给出。因为自己学爬虫没多久，记录一下梳理下思路，也可以为以后有需要的时候做参考。
为什么使用python保存图片存在图片部分缺失_关于python并发爬虫的一些经验总结...
2021-01-24 12:20

泥潭小猪的博客 1.背景代码地址：Maicius/QQZoneMood网站：QQ空间数据分析-小麦冬最近出于兴趣...而仅仅是获取一条QQ空间中的完整的说说内容，就至少需要发送5次请求，包括：1.获取说说目录（每页20条）；2.获取说说详情（评论数量...
python爬虫（爬取图片）
2022-08-16 11:41

愈辩已忘言的博客 python爬虫，用来爬取图片，已彼岸为例，可以自行输入要爬取的起始页和终止页
Python 批量爬取猫咪图片实现千图成像
2021-11-03 17:28

编程简单学的博客使用 Python 爬取猫咪图片，并为猫咪????制作千图成像！爬取猫咪图片本文使用的 Python 版本是 3.10.0 版本，可直接在官网下载：www.python.org 。 Pythonn 的安装配置过程在此不做详细介绍，网上随意搜都...
python二：之简单爬虫(图片爬取保存本地文件)
2020-11-05 15:21

九八年的尾巴的博客所谓爬虫，就是将网页当成一个文档...进入spiders文件夹，创建执行类，该类的parse方法就是主要访问的方法 scrapy genspider 文件名要爬取的网址二：打开项目使用PyCharm工具打开下载安装及破解不再做演示代码
爬去图片插件_根据Excel列表链接自动爬取图片
2021-01-05 22:56

孙硕星的博客首先：Excel是这样的，然后我要做的就是把一个一个链接点开，然后把图片下载下来，然后把文件命名为前面的name_id我用的环境是：SpyderPython 3.7然后呢，我的思路就是两步：1.爬下来2.重命名第一步，附上代码import...
fiddler 抓包后批量导出_Python+fiddler：爬取微信公众号的文章
2020-12-27 23:44

weixin_39637921的博客这几天师父有个小项目，挺有意思，如何使用python爬微信公众号中的新闻信息。大体流程如下。图1：流程其实我们看到，这里并没有想象中的“智能”——依然需要手动刷公众号文章，然后才能够收集到信息。（误：更新的...
Python爬取网站数据
2024-03-17 20:08

Vermouth-1的博客 Python爬取网站数据前言什么是爬虫？通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程爬虫合法还是违法？在法律上是不被禁止的但是也有违法风险爬虫带来的风险可以体现在如下2方面爬虫...
Python爬虫入门【4】：美空网未登录图片爬取
2019-07-20 21:59

未衬老师的博客上一篇写的时间有点长了，接下来继续把美空网的爬虫写完，这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点，因为它只是一套入门的教程，老鸟你自动绕过就可以了，或者带带我也行。...
没有解决我的问题, 去提问

悬赏问题

¥15 做个有关计算的小程序
¥15 MPI读取tif文件无法正常给各进程分配路径
¥15 如何用MATLAB实现以下三个公式（有相互嵌套）
¥30 关于#算法#的问题：运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题求各位帮我解答一下
¥15 setInterval 页面闪烁，怎么解决
¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题
¥15 如何用Python爬取各高校教师公开的教育和工作经历
¥15 TLE9879QXA40 电机驱动
¥20 对于工程问题的非线性数学模型进行线性化

爬取商品图片，alt中名字相同，执行后只有一张图，把改为src后就报错，

2条回答 默认 最新

悬赏问题

2条回答默认最新