爬取商品图片，alt中名字相同，执行后只有一张图，把改为src后就报错，

import requests
import os
from lxml import etree
if __name__ == "__main__":

    # 爬取页面源码数据
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }   # UA伪装
    url = 'https://item.jd.com/100021007440.html'
    page_text = requests.get(url=url,headers = headers).text
    # 手动设定响应数据的编码格式
    # res = requests.get(url=url,headers = headers)
    # res.encoding = 'utf-8'
    # page_text = res.text

    # 页面数据解析
    tree = etree.HTML(page_text)
    # 创建一个文件夹
    if not os.path.exists('./jd_img'):
        os.mkdir('./jd_img')
    li_list = tree.xpath('//*[@id="spec-list"]//li')
    for li in li_list:
        #局部解析 获取src 与 alt
        img_src = li.xpath('./img/@src')[0]
        img_name = li.xpath('./img/@src')[0]+'.jpg'
        # 通用处理中文乱码的解析方式
        # img_name = img_name.encode('iso-8859-1').decode('gbk')

        url = 'http:'+img_src

        # 爬取图片数据content
        pic_content = requests.get(url= url,headers = headers).content

        #持久化存储
        img_path = 'jd_img/' + img_name
        fp = open(img_path,'wb')
        fp.write(pic_content)
        print(img_name,'下载成功')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-06-19 10:39
关注
改成src后，图片名称这样写，img_name=img_src.split('/')[-1]，代码中的写法有误。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

爬取商品图片，alt中名字相同，执行后只有一张图，把改为src后就报错， python 有问必答
2021-06-19 09:36

回答 2 已采纳改成src后，图片名称这样写，img_name=img_src.split('/')[-1]，代码中的写法有误。
python爬取图片报错TypeError python 爬虫
2022-12-29 23:52

回答 1 已采纳你这是没有爬到，数据为空的才报的错。可以使用异常处理try一下，再处理为空的情况
求助：python爬取图片，怎么取出标签里的src内容？ python
2020-09-01 20:40

回答 6 已采纳源码中有包含所有图片url的json对象 ![图片说明](https://img-ask.csdn.net/upload/202009/03/1599063207_992984.jpg) 因此可以
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一...答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，这门语言入门挺简单的，特别是对于那些有其他编程语言经验的人。
用JS修改图片src时为什么会报错，求解答 javascript 有问必答
2022-01-16 16:13

回答 1 已采纳 var img = document.getElementsByClassName("img")[0]; //获取img标签===>改下面这个，getElementsByClassName是通过
python爬虫爬取斗图啦上的图片，打开爬取的图片显示图片错误 python
2019-08-03 11:41

回答 3 已采纳已经解决，data-origina属性是一个网址，所以在这里要再requests.get(data).content这样才是图片内容。图片应该以二进制方式储存，所以应该以wb模式写入
为什么python爬取下来的json格式的数据解析后不能用列表推导式输出数据? python 有问必答
2021-06-10 15:32

回答 3 已采纳 title = [i['title'] for i in data['data']['list']]
怎么用python爬图片_(Python爬虫爬取图片这个报错怎么处理？)
2020-11-24 05:35

weixin_39837867的博客想想Python爬一些风景图片，能否有人一步步教我把想爬的网站给我，我爬好把教程写给你Python爬虫爬取图片这个报错怎么处理？你好！你的错误在于html页面img标签src属性中的链接，可能是因为src中的url格这样的：这样...
在Python中xpath爬图片src有问题 python
2022-09-27 00:17

回答 5 已采纳 import urllib.request from lxml import etree def create_request(page): if (page == 1):
Python爬取图片问题 python
2021-04-07 06:15

回答 2 已采纳题主存在问题是：保存图片路径是写死的，循环中会一直覆盖写入"python爬虫图片实验2.jpg"这张图片，所以最后只能得到一张图片修改：保存图片路径需要改一下，让每一次循环时，图片写入不
为什么python报错但是能运行出一部分正确结果呢？ python
2021-07-27 17:34

回答 1 已采纳 import requests from lxml import etree if __name__ == '__main__': url='http://www.netbian.com/
Python爬取读书网的图片链接和书名并保存在数据库中
2023-10-31 21:48

Big-Peng的博客这个爬虫项目应该可以适用于挺多场景的，不是特别多，跟着写一下也没啥坏处。如果有代码的需求的话，日后会把项目的代码地址给出。因为自己学爬虫没多久，记录一下梳理下思路，也可以为以后有需要的时候做参考。
python爬取网页内容时，没有报错，也有文件出来，但是啥也没爬到T_T这是为啥 python 爬虫
2021-11-21 13:55

回答 2 已采纳先看下返回的Response里是啥内容
Python 批量爬取猫咪图片实现千图成像
2021-11-03 17:28

编程简单学的博客使用 Python 爬取猫咪图片，并为猫咪????制作千图成像！爬取猫咪图片本文使用的 Python 版本是 3.10.0 版本，可直接在官网下载：www.python.org 。 Pythonn 的安装配置过程在此不做详细介绍，网上随意搜都...
python爬虫（爬取图片）
2022-08-16 11:41

愈辩已忘言的博客 python爬虫，用来爬取图片，已彼岸为例，可以自行输入要爬取的起始页和终止页
python二：之简单爬虫(图片爬取保存本地文件)
2020-11-05 15:21

九八年的尾巴的博客所谓爬虫，就是将网页当成一个文档...进入spiders文件夹，创建执行类，该类的parse方法就是主要访问的方法 scrapy genspider 文件名要爬取的网址二：打开项目使用PyCharm工具打开下载安装及破解不再做演示代码
Python爬虫入门【4】：美空网未登录图片爬取
2019-07-20 21:59

未衬老师的博客上一篇写的时间有点长了，接下来继续把美空网的爬虫写完，这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点，因为它只是一套入门的教程，老鸟你自动绕过就可以了，或者带带我也行。...
Python爬虫入门教程【4】：美空网未登录图片爬取
2019-07-25 16:38

追梦IT男的博客上一篇写的时间有点长了，接下来继续把美空网的爬虫写完，这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点，因为它只是一套入门的教程，老鸟你自动绕过就可以了，或者带带我也行。...
Python爬取网站数据
2024-03-17 20:08

Vermouth-1的博客 Python爬取网站数据前言什么是爬虫？通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程爬虫合法还是违法？在法律上是不被禁止的但是也有违法风险爬虫带来的风险可以体现在如下2方面爬虫...
史上最详细Python爬取电影教程，还不会那也是没谁了
2018-12-29 18:59

weixin_44099558的博客摘要：作为小白，爬虫可以说是入门python最快和最容易获得成就感的途径。因为初级爬虫的套路相对固定，常见的方法只有几种，比较好上手。选取网页结构较为简单的猫眼top100电影为案例进行练习。重点是用上述所说...
没有解决我的问题, 去提问

悬赏问题

¥15 c语言怎么用printf（“\b \b”）与getch（）实现黑框里写入与删除？
¥20 怎么用dlib库的算法识别小麦病虫害
¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
¥15 java写代码遇到问题，求帮助
¥15 uniapp uview http 如何实现统一的请求异常信息提示？
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？

爬取商品图片，alt中名字相同，执行后只有一张图，把改为src后就报错，

2条回答 默认 最新

悬赏问题

2条回答默认最新