A Lucky 2021-05-06 21:16 采纳率: 80%
浏览 203
已采纳

nu_url=format(url % pageNum )报错不是所有参数都在字符串格式化期间转换

import re
import requests
import os  # 创建文件夹模块
if __name__=='__main__':
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'
    }


  
    if not os.path.exists('../正则/qiutuLibs'):

        os.mkdir('../正则/qiutuLibs')
    url = 'https://www.qiushibaike.com/imgrank/page/2/'



   
    for pageNum in range(2, 4):
       
        nu_url=format(url % pageNum )
        # 用format:格式  函数,format返回的字符串把它赋值给new_url


   
    page_text = requests.get( url=nu_url, headers=headers ).text
   
  
    ex = '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
    img_src_list = re.findall(ex, page_text, re.S)
  
    print(img_src_list)  # 得到一页的图片url列表
    # 将列表当中的每一个图片地址单独的进行一个get请求,下面便利列表
    for src in img_src_list:
        # 拼接出一个完整图片url地址
        src = 'http:'+src
        
        img_data = requests.get(url=src, headers=headers).content  # 图片是二进制的响应数据content
       
        # 将图片的名称根据/切分要/后面的名称
        # 指定图片的路径,文件夹的名称加上图片名称,[-1]就是后面的.jpg
        img_path = './qiutu1'+img_name
        with open(img_path, 'wb') as fp:
            fp.write(img_data)
            print(img_name, '下载成功')
  • 写回答

1条回答 默认 最新

  • Nick Peng 2021-05-06 22:39
    关注
    nu_url = f'https://www.qiushibaike.com/imgrank/page/{pageNum}/'
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?