Python爬取笔趣阁小说只保存第一章，哪里出错了

from selenium import webdriver
from bs4 import BeautifulSoup
import time

PATH = 'C:\Program Files\chromedriver.exe'
driver = webdriver.Chrome(PATH)
driver.get('http://www.xbiquge.la/41/41495/18842440.html')
content = driver.page_source.encode('utf-8').strip()
soup = BeautifulSoup(content, 'lxml')


# get information
def getinfo():
    chapter_name = soup.find('div', class_='bookname').h1
    chapter_info = soup.find('div', id='content')
    with open(r'C:\Users\14155\Desktop\Python\爬虫实战案例\笔趣阁\全属性武道\{}.txt'.format(chapter_name.text[4:]), 'w',
              encoding='utf-8') as f:
        f.write(chapter_name.text.strip() + "\n\n" + chapter_info.text.replace(' ', ''))


# next chapter
def nextchapter():
    next_chapter = driver.find_element_by_link_text('下一章')
    next_chapter.click()


def main():
    for i in range(5):
        getinfo()
        nextchapter()


main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
木三136 2021-04-06 14:02
关注
您的soup只访问了一次，就是说getinfo()这个函数一直在对第一章进行操作

您可以在每次使用getinfo()这个函数时，先更改一下soup

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python爬取笔趣阁小说只保存第一章，哪里出错了 python
2021-04-06 12:31

回答 3 已采纳您的soup只访问了一次，就是说getinfo()这个函数一直在对第一章进行操作您可以在每次使用getinfo()这个函数时，先更改一下soup
我想多线程爬取笔趣阁的一部小说但是函数不执行 python
2021-09-14 08:26

回答 5 已采纳流程如下代码所示，但是笔趣阁服务器不咋地，也没啥太大限制的反爬，所以开50个线程基本上就是反馈503了，如果你有代理ip可以加进去，然后就是线程开少点，爬取速度限制一下，比如在每个章节获取里slee
爬取笔趣阁的小说出现错误，正则表达式和网页解码 python 爬虫
2021-08-20 17:11

回答 1 已采纳原文是双引号，你写成单引号了，所以识别不到章节目录有帮助望采纳
Python爬取新笔趣阁小说
2021-06-28 20:21

独星的博客我写的这篇文章，是利用Python爬取小说编写的程序，这是我学习Python爬虫当中自己独立写的第一个程序，中途也遇到了一些困难，但是最后迎刃而解了。这个程序非常的简单，程序的大概就是先获取网页的源代码，然后在...
Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 21:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
让字符串中的反斜杠不作为转义符号 python 有问必答
2021-06-04 22:28

回答 2 已采纳可以用字符串替换方法，先把/全部替换成空的字符，应该就能解决你的问题啦。
python爬取笔趣阁
2020-05-29 19:45

singlezzz的博客不过我不是通过这种方法写的，我是根据第一章的下一章的链接爬取，通过不断循环。代码如下：前面常规操作就不写注释了。主入口小白一枚，代码有点丑，，，大佬勿喷。 import requests import parsel def ...
python爬取小说写入txt_对新笔趣阁小说进行爬取，保存和下载！这就是Python的魅力...
2020-11-23 16:10

weixin_39688170的博客这就是Python的魅力以前挺爱在笔趣阁看小说的（老白嫖怪了）现在学了一点爬虫技术，就自然而然的想到了爬取笔趣阁的小说也算锻炼一下自己的技术，就以新笔趣阁开始分析对每一个小说目录界面的url还是很容易得到的如...
python爬取最新说章节_Python爬取新笔趣阁小说
2021-02-04 05:52

兔子313的博客 Python爬取小说，并保存到TXT文件中我写的这篇文章，是利用Python爬取小说编写的程序，这是我学习Python爬虫当中自己独立写的第一个程序，中途也遇到了一些困难，但是最后迎刃而解了。这个程序非常的简单，程序的...
python3爬取笔趣阁小说
2019-07-15 14:29

K_CEN的博客爬虫第一步：确定要爬取的信息确定要爬取的网站的URL地址：http://www.xbiquge.la/6/6818/ 第二步：分析网站信息爬小说要获取小说章节目录名称和每一章的阅读链接第三步：编写代码：本次爬虫练习完整代码，...
【爬虫】对新笔趣阁小说进行爬取，保存和下载
2020-11-21 01:37

ζ云帆い的博客现在学了一点爬虫技术，就自然而然的想到了爬取笔趣阁的小说也算锻炼一下自己的技术，就以新笔趣阁开始分析对每一个小说目录界面的url还是很容易得到的如圣墟：http://www.xbiquge.la/13/13959/可以知道，遍历从...
python爬取网站的小说代码
2020-07-26 14:37

Atonement*的博客 ======================分割线==========================================================================注：如果遇到爬到一半突然报错的情况，可以重新运行然后更改从出错的章节开始运行即可。谷歌浏览器为例...
Python爬虫：爬取一部自己喜欢的小说
2018-12-14 15:39

cRack_cLick的博客我们首先从最简单的爬虫开始学习，我知道的一个小说网站——笔趣阁（http://www.biquw.com），无须登录，无须进行header验证，而且响应返回的是标准的HTML页面，可以说是对新手非常友好了。博主建议大家，爬取网站...
python爬虫实例之小说爬取器
2020-02-27 19:22

桑梓南的博客今天和大家分享一个爬取盗版小说的实例。如今的网络小说可谓是百家齐放各领风骚，玄幻科幻穿越修仙都市… 各种套路看得大家是心潮澎湃，笔者曾经也蛮喜欢看小说的，以前经常是拿着一台诺基亚看到深夜，第二天带着...
1.python学习
2020-11-11 21:02

Six dog的博客前一阵无聊想学习python，就有了以下代码，选取了笔趣阁这个大众化的网站，百度发现以笔趣阁为名的小说网站很多，本段代码只在百度结果里选取前五条，并选取了三个叫笔趣阁的网站，前五条里包含笔趣阁的任意一个网址...
基于Python实现的网络爬虫项目——多线程下载小说并保存为txt文件（包含完整代码及注释）
2021-12-13 21:40

将进酒23的博客基于Python实现的网络爬虫项目——多线程下载小说并保存为txt文件一、确立预期目标二、完成项目所需工具三、项目需要解决的问题问题一问题二问题三问题四问题五问题六四、对应问题解决方法问题一解决方法及思路问题...
python爬虫——从此不用再愁找不到小说txt文件
2017-08-09 20:42

God_white的博客看小说者的福利神器
python找不到txt_python爬虫——从此不用再愁找不到小说txt文件
2020-11-20 23:46

weixin_39888807的博客 python爬虫——从此不用再愁找不到小说txt文件最近在学习python，学了个大概就开始写爬虫了，之前做了个糗百的简单爬虫，然后底下还做了一些学校教务系统的爬虫，爬取了自己的成绩，看着挂科的大英，心中一万头...
python综合实验_20194302实验四 Python综合实践
2021-01-30 01:24

赵有名的博客 (1)实战背景小说网站-笔趣看：URL：...因此，本次实战就是从该网站爬取并保存一本名为《一念永恒》的小说，该小说是耳根已完结的一部玄幻小说。PS：本实验仅为交流学习，支持耳根大大，请上起点中文网订阅...
没有解决我的问题, 去提问

悬赏问题

¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错
¥15 这个主板怎么能扩出一两个sata口
¥15 不是，这到底错哪儿了😭
¥15 2020长安杯与连接网探
¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么

Python爬取笔趣阁小说只保存第一章，哪里出错了

3条回答 默认 最新

悬赏问题

3条回答默认最新