Python爬虫爬取必应图片的一个环节，使用xpath获取下载图片的URL时，获取内容为空，检查过xpath语法正确，坐等解决方法



import requests
from lxml import etree

url = 'https://cn.bing.com/images/search?view=detailV2&ccid=lH2TkHTF&id=65167C9E54BD6A516682173F7A4747E63FA4D77E&thid' \
      '=OIP.lH2TkHTFHjovR0wqZFDVoAHaEK&mediaurl=https%3a%2f%2fts1.cn.mm.bing.net%2fth%2fid%2fR-C' \
      '.947d939074c51e3a2f474c2a6450d5a0%3frik%3dftekP%252bZHR3o%252fFw%26riu%3dhttp%253a%252f%252fimg3.donews.com' \
      '%252fuploads%252fimg3%252fimg_pic_1530694840_0%26ehk%3dTqmFU1WejMz%252frQawSVbV7db9KDdl%252fUw5L2HWmPQHqPQ' \
      '%253d%26risl%3d%26pid%3dImgRaw%26r%3d0&exph=1080&expw=1920&q=%e6%95%85%e5%ae%ab&simid=608051165034519383&FORM' \
      '=IRPRST&ck=06B53B135EB364C0A5765DF5E81F6BF7&selectedIndex=33&qft=+filterui%3aimagesize-custom_1920_1080&vt=0' \
      '&sim=11 '
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.188 '
    }
res = requests.get(url=url, headers=headers)
page = res.text
ele = etree.HTML(page)
new_url = ele.xpath('//div[@class="imgContainer"]/img/@src')
print(new_url)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-08-07 19:16
关注
【以下回答由 GPT 生成】

首先，我们需要检查爬虫是否能够成功获取到网页的内容。可以使用requests库发送GET请求来获取网页内容。

import requests response = requests.get(url) print(response.status_code) print(response.text)

如果输出的status_code为200，并且text显示了网页的内容，说明爬虫可以成功获取到必应图片网页的内容。如果输出的status_code不是200，则可能是网络连接问题，可以检查网络连接或者尝试使用代理。

接下来，我们需要确认XPath表达式是否正确。可以使用lxml库来解析网页内容，并使用XPath表达式提取需要的链接。

from lxml import etree html = etree.HTML(response.text) urls = html.xpath('YOUR_XPATH_EXPRESSION') print(urls)

在这里，你需要将YOUR_XPATH_EXPRESSION替换为正确的XPath表达式。如果urls的结果为空列表，可能是XPath表达式错误，你可以再次检查并确保XPath表达式确实能够提取到链接。

最后，如果以上步骤都没有问题，但仍然无法获取到链接，有可能是图片链接是动态加载的。这种情况下，你需要分析网页的网络请求，找到加载图片链接的请求，并模拟发送该请求获取到图片链接。

希望以上解决方案能够帮助你解决问题，如果还有其他疑问，请随时提问！

【相关推荐】

帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7500674
我还给你找了一篇非常好的博客，你可以看看是否有帮助，链接：用xpath批量爬取高清图片图解教程 python 爬虫
除此之外, 这篇博客: python爬虫：xpath爬取静态网页中的 构造URL 部分也许能够解决你的问题。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python3爬虫学习-爬取图片批量下载 XPATH
2021-01-21 17:06

总的来说爬虫不难，会python的简单语法，会xpath提取网页需要的信息，就可以很快的爬取网站的图片，同时也希望以此来激起大家学习的兴趣。文章导航一、环境二、源码三、部分源码分析3.1 获取网站html网页数据源码...
Python使用xpath实现图片爬取
2020-09-17 11:24

使用`Pool(10)`创建一个包含10个工作线程的线程池，通过`pool1.map()`并行处理每个页面的图片下载任务，提高爬取效率。异步爬虫的目的是提升爬取速度，避免阻塞。在上述代码中，虽然没有直接实现异步处理，但是...
Python使用xpath爬取网站数据
2025-04-03 17:28

而Python的数据爬取主要依赖于第三方库，比如requests用于发送网络请求，BeautifulSoup和lxml用于解析网页内容，而XPath就是其中的一种选择器语言，用于从HTML或XML文档中选取节点。接下来，我们具体探讨XPath的...
【Python爬虫】使用request和xpath爬取高清美女图片
2024-05-08 13:20

熊哈哈O_o的博客 pyhton小白爬虫教学，爬取网站上的美女图片。
Python爬虫爬取豆瓣数据XPath的使用
2022-01-18 17:13

侯小啾的博客通过使用requests. lxml, csv 三个模块，爬取豆瓣电影Top250的电影名称，评分，引言，详情页的url。爬取1-10页，并保存在csv文件中。
python爬虫系列：xpath爬取图片讲解（零基础向）
2021-06-23 18:33

AuroBreeze的博客例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入...
爬虫开发-基于Python实现爬取百度高清摄影图片.zip
2024-04-03 11:48

我们需要创建一个专门的目录保存下载的图片，同时可以利用os模块的rename()方法为图片赋予有意义的名称，便于管理和查看。在整个爬虫开发过程中，异常处理是必不可少的。我们需要捕获可能出现的网络错误、解析错误...
Python爬虫xpath使用例，爬取图片
2022-07-20 00:22

瑆玥琼的博客本例教程嫌麻烦可直接跳到最底下复制代码粘贴运行，在Python中完成爬虫功能分三步，建立网页请求——解析网页——保存文件。
python 获取li的内容_Python爬虫神器Xpath的使用
2020-11-20 10:50

weixin_39756235的博客在用 Python 实现爬虫时，可以使用 requests 库访问资源，然后用正则表达式提取信息。但是，这里会有一些繁琐，因为正则表达式的书写是比较严格的，万一有一个地方写错了，可能会导致匹配失败无法提取需要的信息。...
python爬虫xpath怎么获取别的网址_Python爬虫十六式 - 第四式: 使用Xpath提取网页内容...
2020-12-04 04:42

weixin_39583162的博客 Xpath：简单易用的网页内容提取工具学习一时爽，一直学习一直爽 !Hello，大家好，我是Connor，一个从无到有的技术小白。上一次我们说到了 requests 的使用方法。到上节课为止，我们已经学完了所有的 Python 常用的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月7日

Python爬虫爬取必应图片的一个环节，使用xpath获取下载图片的URL时，获取内容为空，检查过xpath语法正确，坐等解决方法

1条回答 默认 最新

问题事件

1条回答默认最新