爬虫问题，如何爬去一本免费小说

python 如何爬去一整本小说，目前可以通过xpath爬取小说一章的内容，如何爬去多个章节。

目前分析得出：
第一章的内容xxx/898989/789.html
第二章的内容xxx/898989/900.html
第三章的内容xxx/898989/988.html

很变态，从789,900,到988，没有什么规律，跪求大师点拨，谢谢。如何一次搞定爬去多章。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

9条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-08-04 09:31
关注
网页上总有下一章、上一章、回目录这些链接吧，先在页面上得到这里的链接，然后再爬对应的页面。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫一个小问题 python 爬虫
2023-02-17 09:21

回答 5 已采纳你的原代码拷贝过来执行的话，name返回的是None，也就是说你的选择器没有找到你期望的内容，调试代码修改如下：注意看打印输出的内容：所以检查下css选择器的代码是否正确吧有帮助的话，请点采
关于使用python实现的网页爬虫程序卡死的问题 python 有问必答爬虫
2021-08-07 13:04

回答 3 已采纳你可以用time模块进行计时，每过10分钟先用os.system()重新打开程序，然后调用sys.exit()关闭旧进程如果有用，希望采纳哦~
Python爬虫只解析了一部分网页？ python 爬虫
2021-11-19 14:39

回答 1 已采纳第一个问题，你用html.xpath('//div[@class="co_content8"]/ul/table')找不到，是因为在table那一类，有很多分支标签，所以定位不到具体的元素。第二个问题
Python爬虫爬取一本小说
2022-10-25 18:56

Giant-Fox的博客附：如果需要下载其他的小说修改网址和user-Agent接口即可。需要用到requests和re etree这三个库。requests需要安装好环境。
一个python requests 爬虫遇到乱码的问题 python 爬虫
2022-01-24 15:24

回答 2 已采纳 jsonData='{"\u6d4b\u8bd5": 12345, "\u5185\u5bb9": ["\u6211\u4e5f\u4e0d\u77e5\u9053\u6211\u8981\u5199
如何使用python爬虫从企查查上获得专利文献内容？ python windows 有问必答爬虫
2021-12-18 11:16

回答 2 已采纳题主要的代码如下， from bs4 import BeautifulSoup import requests header = {"user-agent":"Mozilla/5.0.html (
爬虫selenium打开Chrome浏览器闪退 python 爬虫
2022-11-09 18:59

回答 3 已采纳
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的爬虫），爬虫再进行数据解析、保存等一系列操作。爬虫可以节省...
关于爬虫爬取页数的问题 json python 爬虫
2022-09-14 23:27

回答 2 已采纳 import requests import re import json import time fh = open('测试写入.txt', 'a') for i in range(1, 20,
刚开始学网络爬虫，第一个程序，只能打出来hello这是为什么啊 python 爬虫
2022-03-17 11:32

回答 1 已采纳你这个xpath取到的内容本来就是空的，当然打印不出东西
爬虫中关于图形验证码的解决方式疑问 python 爬虫
2021-08-15 20:44

回答 1 已采纳建议换个方向学，图形验证用打码平台就行，简单的当然可以用你说的那个，不过现在基本没人用那个。
分享Python7个爬虫小案例（附源码）
2022-10-22 07:00

艾派森的博客本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点，非常适合刚入门python爬虫的小伙伴参考学习。
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
基于python爬虫的中国疫情数据可视化分析
2022-04-24 15:32

包含了所有的源代码，本项目是一个练手的爬虫小案例。
Python爬虫篇：爬虫笔记合集
2022-04-20 17:30

五包辣条！的博客学习爬虫你完全可以理解为找辣条君借钱（借100万），首先如果想找辣条借钱那首先需要知道我的居住地址，然后想办法去到辣条的所在的（可以走路可以坐车），然后辣条身上的东西比较多，有100万，打火机，烟，手机衣服...
没有解决我的问题, 去提问

悬赏问题

¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试
¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元

爬虫问题，如何爬去一本免费小说

9条回答 默认 最新

悬赏问题

9条回答默认最新