python爬虫基础问题。

感谢！
问题有点多。

import urllib.request
#导入urllib包里的request模块。
import re
#导入正则re模块。

from urllib.error import URLError,HTTPError,ContentTooShortError
#从urllib里的error模块导入URLError,HTTPError,ContentTooShortError这三种错误类型。

def download(url,use_agent='wswp',num_retries=2,charset='utf-8'):
#定义一个名为download的函数，该函数有一个叫url的形参；一个名为use_agent,值等于wswp的默参；一个名为num_retries,值等于2的默参；一个名为charset，值为'utf-8'的默参。
print('下载中：',url)
#在ide上显示'下载中：'这个文本和url。
request=urllib.request.Request(url)
#?
request.add_header('User-agent',use_agent)
#添加请求头。
try:
#检测下面的代码是否错误。
resp=urllib.request.urlopen(request)
#urlopen方法用于获取页面内容，返回的数据格式为bytes类型（bytes类型是指一堆字节的集合）。需要decode()解码，转换成str类型。
cs=resp.headers.get_content_charset()
#？
if not cs:
#？
cs=charset
#？
html=resp.read().decode(cs)
#？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
超越ct 2022-04-04 19:36
关注
你这个最好把代码报错截图出来，你提问的格式最好调一下，不太好看这个

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫基础问题 python
2022-03-24 10:21

回答 1 已采纳 e.reason 是前面捕获的错误对象（URLError,HTTPError,ContentTooShortError）的reason属性，该属性用于返回错误的原因；为什么要设置为None 这里是
python爬虫数据显示问题 python 爬虫
2022-07-20 16:54

回答 3 已采纳首先，你这里写错了divs = query(".cm-content-box").items()
python爬虫基础python爬虫基础
2023-12-28 00:56

python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础...
python 爬虫基础问题。 python
2022-04-03 08:11

回答 1 已采纳 request=urllib.request.Request(url)就是获取url 这个地址的网页内容存放到 request 里
如何解决python爬虫问题？ python 人工智能爬虫
2022-08-15 09:11

回答 1 已采纳应该是css选择器里面的规则不够明确，可改成href = selectors.css('div.container div div div ul li a::attr(href)').getall()
python爬虫位置问题 python 爬虫
2023-03-08 13:31

回答 2 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ如果您想要提取 div class="detail-context"标签下所有的 tr 标签，并进一步提取每个 tr 中的 td 标签内的内容，可以使用以下代码： impo
【python爬虫】python爬虫基础知识及简单实践
2024-05-17 11:31

【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识...
python爬虫基础小题目报错 python
2022-04-12 13:59

回答 3 已采纳题主，你代码里链接写错了，是点号你写成了逗号 link="http://www.santostang.com/"
python爬虫运行问题 python 数据挖掘爬虫
2023-01-06 11:14

回答 1 已采纳 pip install openpyxl 安装下这个openpyxl库。望采纳哦！！！！
python爬虫问题 python 爬虫
2022-10-09 11:41

回答 2 已采纳
python爬虫基础课件.pdf
2021-06-20 23:44

python爬虫基础课件，课程实例为爬取豆瓣top250电影信息
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
Python爬虫基础知识和反爬机制（案例）
2023-12-27 14:08

Python爬虫基础知识和反爬机制（案例） Python爬虫基础知识和反爬机制（案例） Python爬虫基础知识和反爬机制（案例） Python爬虫基础知识和反爬机制（案例） Python爬虫基础知识和反爬机制（案例） Python爬虫基础...
python爬虫课件+代码.zip
2021-07-25 12:18

跟着路飞学城樵夫老师一点点敲的，都能跑通，后面的爬取数据添加到excel和mysql数据库是看的另外老师的视频
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月4日

悬赏问题

¥15 关于超局变量获取查询的问题
¥20 Vs code Mac系统 PHP Debug调试环境配置
¥60 大一项目课，微信小程序
¥15 求视频摘要youtube和ovp数据集
¥15 在启动roslaunch时出现如下问题
¥15 汇编语言实现加减法计算器的功能
¥20 关于多单片机模块化的一些问题
¥30 seata使用出现报错，其他服务找不到seata
¥35 引用csv数据文件（4列1800行），通过高斯-赛德尔法拟合曲线，在选取（每五十点取1点）数据，求该数据点的曲率中心。
¥20 程序只发送0X01,串口助手显示不正确,配置看了没有问题115200-8-1-no，如何解决？

python爬虫基础问题。

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新