小白Vayne 2023-11-18 17:44 采纳率: 33.3%
浏览 4

pyhton爬虫为啥xpath获取图片结果是这个而不是图片


from lxml import etree
import urllib.request

url = 'https://www.mxbc.com/product'

response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
tree = etree.HTML(content)
img_list = tree.xpath('//li[@class="row-3"]/a/figure/img/@src')
#//div[@class="coffee-hot"]/p/img/@src
for img in img_list:
    print(img)
print(img)

img

  • 写回答

1条回答 默认 最新

  • 无序繁星 2023-11-18 21:06
    关注

    下面换成这个试试?

    img_list = tree.xpath('//li[@class="row-3"]/a/figure/img/@data-original')
    
    import urllib.parse
    base_url = "https://www.mxbc.com/"
    for img in img_list:
        img_name = img.split('/')[-1]
        urllib.request.urlretrieve(base_url + urllib.parse.quote(img), img_name)
    
    评论

报告相同问题?

问题事件

  • 创建了问题 11月18日