python使用requests大批量请求卡住怎么解决？

我用python的request抓取别人网站抓了几100条左右就卡死了是什么情况？

page=request.GET.get('page')
    for pages in range(1,int(page)+1):
        data = requests.get("http://okokzy.cc/?m=vod-type-id-1-pg-"+str(pages)+".html")
        data.encoding = "utf-8"
        data = data.text
        data = etree.HTML(data)
        name = data.xpath("//div[@class='xing_vb']/ul/li/span[@class='xing_vb4']/a/text()")
        link = data.xpath("//div[@class='xing_vb']/ul/li/span[@class='xing_vb4']/a/@href")
        listcode = 0
                print(link)

没有任何报错也没有发现任何异常就是打印出来的东西打印到某一条到时候就不动了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
熊猿 2019-01-29 18:51
关注
首先你的request最好设置一下超时，如果某个链接长时间没响应，你就会阻塞在那里；然后得百分百确认你的xpath是正确的，且是匹配里面所有url的，这个地方可以打个日志，看看是阻塞在某次循环了，还是xpath没有解析到数据

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

python使用requests大批量请求卡住怎么解决？ linux python
2019-01-29 16:24

回答 6 已采纳首先你的request最好设置一下超时，如果某个链接长时间没响应，你就会阻塞在那里；然后得百分百确认你的xpath是正确的，且是匹配里面所有url的，这个地方可以打个日志，看看是阻塞在某次循环了，还是
python requests无结果，如何解决？ python 有问必答
2021-12-15 15:26

回答 1 已采纳加上cookie headers = { 'content-type': 'text/html; charset=GBK', 'User-Agent': 'Mozilla/5.0 (W
Python的requests不能被函数调用吗？ https javascript python
2022-02-19 01:02

回答 2 已采纳可以被函数调用的，只是变量r是局部变量，在这个函数之外不能使用。你可以在构造函数里面定义这个变量r，弄成self.r。或者在外面直接将r定义为全局变量
python同时发大量请求_用Python做大批量请求发送
2020-11-29 16:24

weixin_39615402的博客大批量请求发送需要考虑的几个因素:1. 服务器承载能力(网络带宽/硬件配置);2. 客户端IO情况, 客户端带宽, 硬件配置;方案:1. 方案都是相对的;2. 因为这里我的情况是客户机只有一台,所以不能考虑使用分布式了, 服务器...
请问一下，python requests post怎么请求这种格式？ python
2021-04-28 18:58

回答 1 已采纳 steps 的请求数据是 [1] ? 还是 [步骤1] ？
Python中使用requests发送POST请求，最后为什么返回了401？ python
2018-05-03 02:07

回答 3 已采纳参数写错了,你的username拼接了,写成这样,我postman试过了可以 {'consumer_key': '77081-4664470ecdeaa9c127925c30', 'access_to
请问如何解决python无法安装requests-html模块的问题？ python 有问必答
2021-10-20 00:01

回答 1 已采纳建议到网站 Python Extension Packages for Windows - Christoph Gohlke
requests大批量请求时连接、读取超时的解决办法
2020-07-07 11:49

micromicrofat的博客需要从5万+个url中下载图片，使用python的requests下载： # 省略for循环代码 >>> requests.get(url, stream=True) 发现在下载到几千幅的时候代码无被阻塞了，故添加超时时间 >>> requests.get...
requests如何Ajax请求的sessionID？ python 爬虫
2022-09-26 16:32

回答 1 已采纳 JS逆向，去js里面寻找sessionID的生成逻辑，然后用python 代码模拟生成
请问请求头中有多个重复的key应该如何使用python的requests请求？ python
2019-09-29 13:00

回答 4 已采纳是我脑子犯浑了吗？标题写的是 ‘请问请求头中有.....’,你截图的部分是Response Headers,是响应头啊，是发起网络请求后，服务器响应的数据包头，非请求头，请求头是Request Hea
python的requests_html出问题了？ python
2020-08-20 13:46

回答 1 已采纳看看你的代码中有没有别的叫做get的变量或者方法。最好换一个名字。
python 大量网络请求_跪着问各位大佬。 Python requests。当你的请求很多很多的时候要怎么优化性能...
2020-12-03 08:14

weixin_39806818的博客 dbow2017-06-30 17:34:45 +08:00要不试试我的库 https://github.com/maliubiao/simple_http还能控制并发量，超时时间### 异步方式```shellIn [21]: def print_it(x):import pprint....: pprint.pprint(x)....:In ...
python的requests请求连接中包含*怎么处理啊 python
2022-05-08 23:02

回答 3 已采纳链接如果没错的话直接在*前面加上反斜杠\ 转义
python:循环请求多个url导致链接超时的解决方案
2022-08-03 21:05

本色温华的博客 url请求超时错误
bulkupdatelinks:Python脚本使用分支链接更新API批量更新链接
2021-04-15 16:39

在给定的标题“bulkupdatelinks:Python脚本使用分支链接更新API批量更新链接”中，我们可以理解到这是一个利用Python编写的脚本，其主要功能是通过调用API接口，对大批量的链接进行更新操作。描述进一步强调了脚本...
没有解决我的问题, 去提问

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

python使用requests大批量请求卡住怎么解决？

6条回答 默认 最新

悬赏问题

6条回答默认最新