爬取小说，只有末尾部分

最近我在爬取小说的时候，出现了爬取到了小说最后一段，开头以及中间部分全部没有了，下面是我写的代码以及请求的内容：


URL = 'https://www.kankezw.com/du/23/23361/1633023.html'

head = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36 Edg/92.0.902.78'
}

html = requests.get(url=URL, headers=head)
html.encoding = 'utf-8'
page_txt = BeautifulSoup(html.text, 'html.parser')
html_txt = page_txt.find('div', attrs={'id': 'content1'})

print(html_txt.text)

站在原地望着少年那恍如与世隔绝的孤独背影，萧薰儿踌躇了一会，然后在身后一干嫉妒的狼嚎声中，快步追了上去，与少年并肩而行…

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2021-08-22 12:57
关注
没问题啊，是不是软件输出超过缓存了只显示最后的

import requests from bs4 import BeautifulSoup URL = 'https://www.kankezw.com/du/23/23361/1633023.html' head = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36 Edg/92.0.902.78' } html = requests.get(url=URL, headers=head) html.encoding = 'utf-8' page_txt = BeautifulSoup(html.text, 'html.parser') html_txt = page_txt.find('div', attrs={'id': 'content1'}) print(html_txt.text)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫实战——小说爬取
2023-05-21 21:01

清清清清弦的博客基于requests库和lxml库编写的爬虫，目标小说网站域名http://www.365kk.cc/，类似的小说网站殊途同归，均可采用本文方法爬取。
python爬取小说爬取,爬取小说（步骤五）python
2021-04-27 08:49

我的手表是荧光的的博客假设各位老哥已经安装好了bs4 requests这些库了这个小说是随便挑的，各位也就不用太介意(仅供各位学习)python3 实现，网上用python2做爬虫的太多了，但用python3的还是比较少通过步骤四中寻找到的那些url来对逐步...
python爬取小说写入txt_python 爬取网络小说清洗并下载至txt文件
2020-11-20 18:52

weixin_39998903的博客环境：pycharm2017、python3.7 对于初学者来说，爬取小说是最简单的应用，而对于没有任何语法基础的人来说，清晰的逻辑往往比大段的代码更重要。整个过程分为以下几步： 1.确定爬取目标（网页，前段页面）首先要...
Python爬虫爬取小说
2024-05-30 23:31

无敌の星仔的博客学会如何使用爬虫去爬取小说，可以作为会了python和requests之后的练手项目
Python爬虫实战训练：爬取网络小说
2024-08-21 21:05

xTryer的博客本篇博文介绍了如何使用python编写一个爬取网络小说的爬虫程序。
python爬取小说代码_爬取小说（步骤一）python
2020-11-20 18:58

weixin_39854951的博客假设各位老哥已经安装好了bs4 requests这些库了这个小说是随便挑的，各位也就不用太介意（仅供各位学习）python3 实现，网上用python2做爬虫的太多了，但用python3的还是比较少爬取的链接是...20行（包括了为了好看而做...
python爬取小说基本信息_爬取小说（步骤三）python
2020-11-25 10:33

weixin_39631632的博客假设各位老哥已经安装好了bs4 requests这些库了这个小说是随便挑的，各位也就不用太介意（仅供各位学习）python3 实现，网上用python2做爬虫的太多了，但用python3的还是比较少爬取的链接是...步骤一的朋友们可以点击...
python爬取的小说和漫画资源
2023-01-03 08:18

在这个主题中，我们聚焦于如何使用Python来爬取小说和漫画资源。Python的网络爬虫库，如BeautifulSoup、Scrapy和Requests，使得从网页抓取信息变得简单易行。首先，让我们深入了解一下Python中的网络爬虫基础。...
python爬取小说展示,Python爬取小说txt
2021-04-27 08:49

唐荣轩的博客 Python爬取小说txtPython爬取小说txt早上偶然看见雨破尘大佬用Python爬了小说，但运行时出现Do you need to install a parser library?这个错误。更改方法，将：soup = BeautifulSoup(result, 'lxml')改为：soup = ...
用python爬取小说。（id定位）
2024-08-20 14:11

仍稽的博客本程序只能用id定位，当然，改一下就能用其他的定位方法了，记住文件是追加，所以...小说网址:https://m.hafuklxt.cc/chapter/15543941/67855658.html。半节点:https://m.hafuklxt.cc/直接上程序，我就说怎么用就好了。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月22日

爬取小说，只有末尾部分

1条回答 默认 最新

问题事件

1条回答默认最新