2201_76006053 2023-07-17 09:46 采纳率: 0%
浏览 41

请问如何用Python爬取哔哩哔哩漫画官网的漫画图片

哔哩哔哩漫画的图片下载地址只能在XHR里看到,html里头没有,这种要怎么爬求思路

img

img


图一中的漫画图片URL不能在HTML里找到,有没有办法用程序自动获取每张图片的下载链接,希望有人能解答,我找了好久都没找到爬哔哩哔哩漫画的文章😭

  • 写回答

2条回答 默认 最新

  • winx96 2023-07-17 10:12
    关注
    1. 分析XHR请求:观察哔哩哔哩漫画官网的网页,并使用浏览器开发者工具(通常按F12键打开)查看XHR(XMLHttpRequest)请求。XHR通常用于异步加载数据,包括漫画图片等。在开发者工具的"Network"或"Network/XHR"选项卡下,找到与漫画图片相关的XHR请求,并查看其请求URL和请求参数。

    2. 模拟请求:使用Python的网络请求库(例如requests)发送模拟的XHR请求,将漫画图片的URL作为请求URL,并提供必要的请求参数。可以尝试直接使用浏览器中观察到的请求URL,或者分析请求参数的构造方式,以便正确地发送请求并获取漫画图片的数据。

    3. 下载图片:一旦获得了漫画图片的数据,你可以将其保存为本地文件。使用Python的文件操作功能,可以将获取到的二进制数据保存为图片文件(例如JPEG、PNG等格式)。

    以下是一个简单的示例代码,演示了如何使用Python的requests库实现上述思路:

    import requests
    
    def download_comic_image(url, filename):
        response = requests.get(url)
        if response.status_code == 200:
            with open(filename, 'wb') as file:
                file.write(response.content)
            print(f"下载成功:{filename}")
        else:
            print(f"下载失败:{filename}")
    
    # 替换为实际的漫画图片URL
    image_url = 'https://example.com/comic_image.jpg'
    # 替换为保存的文件名
    filename = 'comic_image.jpg'
    
    download_comic_image(image_url, filename)
    
    评论

报告相同问题?

问题事件

  • 修改了问题 7月17日
  • 创建了问题 7月17日

悬赏问题

  • ¥15 Opencv(C++)异常
  • ¥15 VScode上配置C语言环境
  • ¥15 汇编语言没有主程序吗?
  • ¥15 这个函数为什么会爆内存
  • ¥15 无法装系统,grub成了顽固拦路虎
  • ¥15 springboot aop 应用启动异常
  • ¥15 matlab有关债券凸性久期的代码
  • ¥15 lvgl v8.2定时器提前到来
  • ¥15 qtcp 发送数据时偶尔会遇到发送数据失败?用的MSVC编译器(标签-qt|关键词-tcp)
  • ¥15 cam_lidar_calibration报错