理论上的生命---史前巨肥猫 2022-04-04 19:19 采纳率: 95.6%
浏览 26

python爬虫基础问题。

感谢!
问题有点多。

import urllib.request
#导入urllib包里的request模块。
import re
#导入正则re模块。

from urllib.error import URLError,HTTPError,ContentTooShortError
#从urllib里的error模块导入URLError,HTTPError,ContentTooShortError这三种错误类型。

def download(url,use_agent='wswp',num_retries=2,charset='utf-8'):
#定义一个名为download的函数,该函数有一个叫url的形参;一个名为use_agent,值等于wswp的默参;一个名为num_retries,值等于2的默参;一个名为charset,值为'utf-8'的默参。
print('下载中:',url)
#在ide上显示'下载中:'这个文本和url。
request=urllib.request.Request(url)
#?
request.add_header('User-agent',use_agent)
#添加请求头。
try:
#检测下面的代码是否错误。
resp=urllib.request.urlopen(request)
#urlopen方法用于获取页面内容,返回的数据格式为bytes类型(bytes类型是指一堆字节的集合)。需要decode()解码,转换成str类型。
cs=resp.headers.get_content_charset()
#?
if not cs:
#?
cs=charset
#?
html=resp.read().decode(cs)
#?

  • 写回答

1条回答 默认 最新

  • 超越ct 2022-04-04 19:36
    关注

    你这个最好把代码报错截图出来,你提问的格式最好调一下,不太好看这个

    评论

报告相同问题?

问题事件

  • 创建了问题 4月4日

悬赏问题

  • ¥15 关于超局变量获取查询的问题
  • ¥20 Vs code Mac系统 PHP Debug调试环境配置
  • ¥60 大一项目课,微信小程序
  • ¥15 求视频摘要youtube和ovp数据集
  • ¥15 在启动roslaunch时出现如下问题
  • ¥15 汇编语言实现加减法计算器的功能
  • ¥20 关于多单片机模块化的一些问题
  • ¥30 seata使用出现报错,其他服务找不到seata
  • ¥35 引用csv数据文件(4列1800行),通过高斯-赛德尔法拟合曲线,在选取(每五十点取1点)数据,求该数据点的曲率中心。
  • ¥20 程序只发送0X01,串口助手显示不正确,配置看了没有问题115200-8-1-no,如何解决?