小白Vayne 2023-11-18 17:44 采纳率: 33.3%
浏览 4

pyhton爬虫为啥xpath获取图片结果是这个而不是图片


from lxml import etree
import urllib.request

url = 'https://www.mxbc.com/product'

response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
tree = etree.HTML(content)
img_list = tree.xpath('//li[@class="row-3"]/a/figure/img/@src')
#//div[@class="coffee-hot"]/p/img/@src
for img in img_list:
    print(img)
print(img)

img

  • 写回答

1条回答 默认 最新

  • 无序繁星 2023-11-18 21:06
    关注

    下面换成这个试试?

    img_list = tree.xpath('//li[@class="row-3"]/a/figure/img/@data-original')
    
    import urllib.parse
    base_url = "https://www.mxbc.com/"
    for img in img_list:
        img_name = img.split('/')[-1]
        urllib.request.urlretrieve(base_url + urllib.parse.quote(img), img_name)
    
    评论

报告相同问题?

问题事件

  • 创建了问题 11月18日

悬赏问题

  • ¥15 x趋于0时tanx-sinx极限可以拆开算吗
  • ¥500 把面具戴到人脸上,请大家贡献智慧
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error
  • ¥15 VS2022+WDK驱动开发环境
  • ¥30 关于#java#的问题,请各位专家解答!
  • ¥30 vue+element根据数据循环生成多个table,如何实现最后一列 平均分合并
  • ¥20 pcf8563时钟芯片不启振