pyhton爬虫为啥xpath获取图片结果是这个而不是图片


from lxml import etree
import urllib.request

url = 'https://www.mxbc.com/product'

response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
tree = etree.HTML(content)
img_list = tree.xpath('//li[@class="row-3"]/a/figure/img/@src')
#//div[@class="coffee-hot"]/p/img/@src
for img in img_list:
    print(img)

print(img)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
无序繁星 2023-11-18 21:06
关注
下面换成这个试试?

img_list = tree.xpath('//li[@class="row-3"]/a/figure/img/@data-original') import urllib.parse base_url = "https://www.mxbc.com/" for img in img_list: img_name = img.split('/')[-1] urllib.request.urlretrieve(base_url + urllib.parse.quote(img), img_name)
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

新pyhton爬虫出问题爬虫
2022-09-26 14:33

回答 1 已采纳具体问题以及报错是什么
用pyhton怎么解决这个数学问题 python
2023-01-22 18:01

回答 1 已采纳任意两个数的差不是5也不是8，可以转化为任意两个数不在同一个5的倍数的序列或8的倍数的序列中。因此，我们可以把1~1989分成5的倍数和8的倍数两类，前者作为A序列，后者作为B序列。如果把A序列中的
这是个PYHTON线程和进程的问题 python
2019-11-24 20:55

回答 1 已采纳多进程简单来说就是多个程序运行实例，每个程序有自己完全独立的内存。所有的变量都互不干涉。多线程就是一个程序在运行，并发执行多个函数，但是共享全局变量，每个函数的参数和私有变量独立。进程的稳定性
28个python爬虫项目，你想要的爬虫知识都准备好了~~
2021-11-24 20:41

爱摸鱼的菜鸟的博客爬虫项目分享，跟基础项目讲解
这是一个关于PYHTON的相关问题 python
2019-11-10 23:37

回答 3 已采纳 print(aa.shuchu())直接修改为 aa.shuchu() 因为你不是返回一个值，而是在shuchu里面自己print的
这是一个关于PYHTON的socket相关问题 python
2019-10-21 23:13

回答 1 已采纳 jiaoyan(header+data).to_bytes(4, byteorder='little', signed=True) 转换成byte
学习当中遇到了这个Pyhton的问题 python
2022-06-17 22:15

回答 1 已采纳程序结果 class Person: def __init__(self,Name,Age,Sex): self.Name = Name self.Age
pyhton 爬图片网站并保存oss
2021-08-19 18:35

Ang-l的博客 pyhton 爬图片网站并保存oss 话不多说直接上代码 from lxml import etree import datetime import io import random import string import uuid import requests import oss2 def parser(img, imageName, ...
这是一个关于pyhton pyqt5的相关问题 python
2019-11-25 12:59

回答 2 已采纳看下你pyqt安装对了没有，在命令行或者pycharm的包管理里面找下建议自动用pip去安装
这是一个关于pyhton端口扫描器的问题 python
2019-11-14 18:31

回答 1 已采纳这个代码是可以扫出的，但是扫一个端口的时间很长，你可以去掉循环直接把你cmd看到的端口填入，就可以看到了。
在学习当中遇到了这个Pyhton的问题 python
2022-06-16 19:11

回答 2 已采纳你写的大错特错，这个是C语言，但是明显题目要的是python用我这个代码吧 def swap(a,b): if a<b: a,b=b,a return a,b a
python教程---网络爬虫
2024-06-30 18:28

东方佑的博客 Urllib是Python内置的一个用于读取来自Web的数据的库。它是一个请求库，可以用来发送HTTP请求，获取网页内容，支持多种HTTP方法，如GET和POST等。以上代码使用Urllib读取了http://www.example.com网站的内容，并将其...
速求一个pyhton代码 python
2022-07-29 12:06

回答 2 已采纳第一题代码，使用快速排序： import random def quick_sort(arr, left, right): # 只有left < right 排序 if lef
爬虫知识综合
2021-07-30 11:04

IT之一小佬的博客通过在settings.py中设置DEPTH_LIMIT的值可以限制爬取深度，这个深度是与start_urls中定义url的相对值。也就是相对url的深度。若定义url为http://www.domz.com/game/,DEPTH_LIMIT=1那么限制爬取的只能是此url下一级...
Python生成个人CSDN历史博客文章列表及目录
2023-01-15 20:30

程序媛一枚~的博客 Invariant Feature Transform）使用Python，OpenCV从静态背景中提取移动前景 OpenCV中的姿势估计及3D效果（3D坐标轴，3D立方体）绘制 Python，OpenCV进行直方图反投影 Java BufferImage图片处理（获取宽高、图片...
Python中Scrapy框架
2022-04-15 13:57

码海探幽的博客日志打印1、日志信息2、 logging 模块四、全站爬取1、使用request排序入队2、继承crawlspider五、二进制文件1、图片下载六、 middlewares1、下载中间件2、爬虫中间件七、模拟登录1、 cookie2、直接登录八、
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月18日

pyhton爬虫为啥xpath获取图片结果是这个而不是图片

1条回答 默认 最新

问题事件

1条回答默认最新