理论上的生命---史前巨肥猫 2022-03-24 10:21 采纳率: 95.7%
浏览 21
已结题

python爬虫基础问题

问题有点多,感谢你的耐心解答!

import urllib.request
from urllib.error import URLError,HTTPError,ContentTooShortError

def download(url,cishu=2):
print ('Downloading:',url)
try:
html=urllib.request.urlopen (url).read()
except (URLError,HTTPError,ContentTooShortError)as e:
print ('Download error:',e.reason) # e.reason是什么?
html=None # 为什么要设置为None?
if cishu>0:
if hasattr(e,"code") and 500 <= e.code < 600: #"code"是什么 ?
return download(url,cishu-1) #它返回的是一个函数的调用,是覆盖了原本的download(url,cishu=2),还是对download(url,cishu=2)复制,创建一个新函数?
return html

  • 写回答

1条回答 默认 最新

  • 烟台大林子 2022-03-24 10:44
    关注
    1. e.reason 是前面捕获的错误对象(URLError,HTTPError,ContentTooShortError)的reason属性,该属性用于返回错误的原因;
    2. 为什么要设置为None 这里是根据自己的业务要求手动制成的,应该是后面要据此进行相关判断,这个需要看自己的使用要求
    3. "code"是什么 ? 这个跟第一个问题有点像,你知道了e是啥,就知道code是啥了;e是捕获的异常对象,code是该对象的一个属性
    4. download(url,cishu-1) 它返回的是一个函数的调用,不是对原有函数的覆盖;打个比方,刀是download函数,你用刀切菜是一种调用,你用刀切水果也是一种调用,刀还是原来的刀。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 4月1日
  • 已采纳回答 3月24日
  • 创建了问题 3月24日

悬赏问题

  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd