理论上的生命---史前巨肥猫 2022-03-24 10:21 采纳率: 95.6%
浏览 21
已结题

python爬虫基础问题

问题有点多,感谢你的耐心解答!

import urllib.request
from urllib.error import URLError,HTTPError,ContentTooShortError

def download(url,cishu=2):
print ('Downloading:',url)
try:
html=urllib.request.urlopen (url).read()
except (URLError,HTTPError,ContentTooShortError)as e:
print ('Download error:',e.reason) # e.reason是什么?
html=None # 为什么要设置为None?
if cishu>0:
if hasattr(e,"code") and 500 <= e.code < 600: #"code"是什么 ?
return download(url,cishu-1) #它返回的是一个函数的调用,是覆盖了原本的download(url,cishu=2),还是对download(url,cishu=2)复制,创建一个新函数?
return html

  • 写回答

1条回答 默认 最新

  • 烟台大林子 2022-03-24 10:44
    关注
    1. e.reason 是前面捕获的错误对象(URLError,HTTPError,ContentTooShortError)的reason属性,该属性用于返回错误的原因;
    2. 为什么要设置为None 这里是根据自己的业务要求手动制成的,应该是后面要据此进行相关判断,这个需要看自己的使用要求
    3. "code"是什么 ? 这个跟第一个问题有点像,你知道了e是啥,就知道code是啥了;e是捕获的异常对象,code是该对象的一个属性
    4. download(url,cishu-1) 它返回的是一个函数的调用,不是对原有函数的覆盖;打个比方,刀是download函数,你用刀切菜是一种调用,你用刀切水果也是一种调用,刀还是原来的刀。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 4月1日
  • 已采纳回答 3月24日
  • 创建了问题 3月24日

悬赏问题

  • ¥15 关于螺旋焊缝的图像处理
  • ¥15 qt 散点图自定义图形
  • ¥100 将USDZ文件转化为带颜色的OBJ文件
  • ¥15 对象代号: , 表单: 不存在!
  • ¥15 WebSocket的问题
  • ¥15 centos上启动kylin后网页报错404
  • ¥20 使用hackrf进行信号收发时接收到的信号幅度太小
  • ¥15 WebSocket的问题
  • ¥15 BDSBAS-B1C和B1C信号有什么不同
  • ¥15 在半圆平面内随机生成点坐标