m0_51873899 2021-01-22 10:20 采纳率: 0%
浏览 36

新人求指点:为什么爬不到图片,那里出问题了

import os
import urllib.request
import requests
from fake_useragent import UserAgent
from bs4 import BeautifulSoup
ua = UserAgent()

download_path = './电影总览'
if not os.path.exists(download_path):
    #创建文件夹
    os.makedirs(download_path)
    
    
def download_picture(url):
    headers = {'User-Agent' : 
    'Mozilla/5.0 (Windows NT 10.0; Win64 x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
    
    
    r = requests.get(url, headers = headers)
    soup = BeautifulSoup(r.text, 'lxml')
    content = soup.find('div', class_ = 'article')
    images = content.find_all('img')
   
    picture_http_list = [image['src'] for image in images]
    picture_name_list = [image['alt'] for image in images]
    
    for picture_name, picture_http in zip (picture_name_list, picture_http_list):
        html = requests.get(picture_http)
        with open(f'{download_path}/{picture_name}.jpg','wb') as f:
            f.write(html.content)
            
def main():
    start_urls = ["https://movie.douban.com/tag/#/"]

    for url in start_urls:
        download_picture(url)
            
main()            
    

  • 写回答

3条回答 默认 最新

  • 芫尘梦 2021-01-22 11:35
    关注

    使用request.urlretrieve(picture_http, '{download_path}/{picture_name}.jpg')试试

    评论

报告相同问题?

悬赏问题

  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记