StussyM 2024-01-27 16:08 采纳率: 22.2%
浏览 4
已结题

爬取知乎首页热榜前五十

爬取首页热榜排名、标题、内容、图片、文档链接,其他的都能爬取出来,图片应该怎么爬取啊。图四是网页源代码

img

img

img

img

  • 写回答

2条回答 默认 最新

  • 小辰代写 2024-01-27 17:06
    关注

    要么就直接保存图片的src路径,用的时候在自己的img标签里填这个src就行,
    好处是操作方便,坏处是断网就访问不到了。
    要么就通过发送请求把图片重命名然后下载到本地,
    这里以百度的图标为例,将其命名为"百度图标.png"然后保存到图片文件中。

    import requests
    import os
    
    img_url="https://www.baidu.com/img/PCtm_d9c8750bed0b3c7d089fa7d55720d6cf.png"
    img_response = requests.get(img_url)
    
    # 设置图片保存路径和文件名
    img_name = os.path.join("./图片", os.path.basename("百度图标.png"))
    
    # 保存图片到本地
    with open(img_name, 'wb') as img_file:
        img_file.write(img_response.content)
    

    有用的话采纳下回答谢谢。

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 2月21日
  • 修改了问题 1月27日
  • 创建了问题 1月27日