理论上的生命---史前巨肥猫 2022-03-24 10:21 采纳率: 95.7%
浏览 21
已结题

python爬虫基础问题

问题有点多,感谢你的耐心解答!

import urllib.request
from urllib.error import URLError,HTTPError,ContentTooShortError

def download(url,cishu=2):
print ('Downloading:',url)
try:
html=urllib.request.urlopen (url).read()
except (URLError,HTTPError,ContentTooShortError)as e:
print ('Download error:',e.reason) # e.reason是什么?
html=None # 为什么要设置为None?
if cishu>0:
if hasattr(e,"code") and 500 <= e.code < 600: #"code"是什么 ?
return download(url,cishu-1) #它返回的是一个函数的调用,是覆盖了原本的download(url,cishu=2),还是对download(url,cishu=2)复制,创建一个新函数?
return html

  • 写回答

1条回答 默认 最新

  • 烟台大林子 2022-03-24 10:44
    关注
    1. e.reason 是前面捕获的错误对象(URLError,HTTPError,ContentTooShortError)的reason属性,该属性用于返回错误的原因;
    2. 为什么要设置为None 这里是根据自己的业务要求手动制成的,应该是后面要据此进行相关判断,这个需要看自己的使用要求
    3. "code"是什么 ? 这个跟第一个问题有点像,你知道了e是啥,就知道code是啥了;e是捕获的异常对象,code是该对象的一个属性
    4. download(url,cishu-1) 它返回的是一个函数的调用,不是对原有函数的覆盖;打个比方,刀是download函数,你用刀切菜是一种调用,你用刀切水果也是一种调用,刀还是原来的刀。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 4月1日
  • 已采纳回答 3月24日
  • 创建了问题 3月24日

悬赏问题

  • ¥15 mysql sum函数优化
  • ¥15 求高通平台Softsim调试经验
  • ¥15 canal如何实现将mysql多张表(月表)采集入库到目标表中(一张表)?
  • ¥15 wpf ScrollViewer实现冻结左侧宽度w范围内的视图
  • ¥15 栅极驱动低侧烧毁MOSFET
  • ¥30 写segy数据时出错3
  • ¥100 linux下qt运行QCefView demo报错
  • ¥50 F1C100S下的红外解码IR_RX驱动问题
  • ¥20 基于matlab的航迹融合 航迹关联 航迹插补
  • ¥15 用Matlab实现图中的光线追迹