Python爬虫，假死解决方法

这是我的代码：

import urllib.request
from bs4 import BeautifulSoup
import re
import codecs
import lxml
import requests
headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'
    }
url = "https://www.23apex.com/xiaoshuo/99545.html"
response = requests.get (url,headers=headers)
soup = BeautifulSoup(response.content,'lxml')
f=codecs.open("斗罗大陆外传史莱克天团1111111111.txt","wb","utf-8")
for link in soup.find_all ('a'):
    x=link.get('href')
    r2=re.compile('/xiaoshuo/99545/',re.I)
    if r2.search(x):
        print (x)
        print (link.text)
        url = 'https://www.23apex.com'+x
        print (url)
        print ("开始爬取....")
        response = requests.get (url,headers=headers)
        print ("正在解析网页....")
        soup = BeautifulSoup(response.content,'lxml')
        print ("解析完成！")
        a = soup.find(id = 'content')
        b = a.get_text()
        f.write(link.text)
        f.write('\n')
        f.write(b)
        f.write('\n\n')
        print ("本章节爬取完成")
        
f.close()

爬几页后，就会出现假死状态。

用的是Python3.9.6

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

解决python爬虫假死问题(程序偷停问题)
2024-01-31 10:09

红目香薰的博客解决python爬虫假死问题(程序偷停问题)
Python爬虫假死的解决
2022-12-16 01:14

Sijin_Yu的博客 Python 爬虫假死 (即爬虫即不报错也不输出异常, 也没有发生死循环, 但是一直卡在一个地方不继续工作) 的解决方案
python线程卡死问题解决了吗_python爬虫多线程假死怎么解决？
2020-12-17 23:31

weixin_39903477的博客抓baidu数据，但跑不了多久就假死，无反应也不报错，初学python，搞了两礼拜没搞明白，望各位前辈指点下#coding:utf-8'''百度排名查询，代理多线程版本'''import StringIO,pycurl,time,random,re,os,csvfrom ...
python爬虫笔记
2024-03-01 23:47

齐飞的博客 python爬虫笔记
python爬虫文件下载很慢卡住线程_python爬虫多线程假死怎么解决？
2020-12-08 17:15

weixin_39787594的博客抓baidu数据，但跑不了多久就假死，无反应也不报错，初学python，搞了两礼拜没搞明白，望各位前辈指点下#coding:utf-8'''百度排名查询，代理多线程版本'''import StringIO,pycurl,time,random,re,os,csvfrom ...
python爬虫
2024-03-12 22:23

小田爱犯困.的博客一.python基础 1.关于爬虫爬虫是指一种自动化程序，可以模拟人的行为从互联网上抓取信息。它可以浏览网页、提取数据、存储数据等。爬虫一般通过发送HTTP请求，并解析返回的HTML页面或其他格式的数据，从中提取出所...
Python爬虫实战--Day02
2024-10-07 06:45

ON.LIN的博客 Python爬虫实战之斗鱼弹幕篇
python分布式爬虫并解决假死问题
2018-08-07 10:27

持久决心的博客 python版本：3.5.4 系统：win10 x64 通过网页下载视频方法一：使用urllib.retrieve函数放函数只需要两个参数即可下载相应内容到本地，一个是网址，一个是保存位置 import urllib.request ...
python 爬虫性能_python爬虫篇之性能相关
2020-12-09 17:04

weixin_39611208的博客需要强调的是：串行并不意味着低效，如果串行的都是纯计算的任务，那么cpu的利用率仍然会很高，之所以爬虫程序的串行低效，是因为爬虫程序是明显的IO密集型程序。二.同步，异步，回调机制在编写爬虫是，性能的消耗...
爬虫基础---python爬虫系列2
2024-10-17 21:16

兆。的博客把源代码转换成节点树使用xPath语法提取内容掌握了这个语法之后，感觉一些比较基础的网址的任何内容都可以爬取了比如，我为了查看自己在CSDN上发表的博客的浏览量，写了python实现csdn文章浏览量日志-CSDN博客。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月2日

Python爬虫，假死解决方法

0条回答 默认 最新

问题事件

0条回答默认最新