我爬虫没办法获取多页这该怎么处理哇

这个网站主要后三位数字变化

但是我这样写确并没有获取到我指定页面的数据

import re
import requests

headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.64',
    'Cookie': 'bcolor=; font=; size=; fontcolor=; width=; Hm_lvt_26c0596a5f449ac3144f90f3a3202786=1624770759,1625320560; hitme=1; hitbookid=17577; Hm_lpvt_26c0596a5f449ac3144f90f3a3202786=1625320791',
    'Referer': 'http://www.dvdspring.com/b/111582/'
}


def parse_page(url):
    response=requests.get(url,headers=headers)
    text=response.text
    titles=re.findall(r'<div class="bookname">.*?<h1>(.*?)</h1>',text,re.DOTALL)
    contents=re.findall(r'<div id="content">(.*?)</div>',text,re.DOTALL)
    fiction=[]
    for content in contents:
        x=re.sub('r<.*?>','',content,flags=re.S)
        fiction.append(x.strip())
        print(x.strip())




def main():
    url='http://www.dvdspring.com/b/111582/479440.html'
    for x in range(441,443):
        url='http://www.dvdspring.com/b/111582/479%s.html'%x
    parse_page(url)


if __name__ == '__main__':
    main()

这是完整的代码，麻烦帮忙看看救救孩子

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
快ྂ乐ྂ至ྂ上ྂ 2021-07-04 00:16
关注
把你第29行这句，缩进一下，放在for循环内。不然是先循环完了才执行，永远都是获得的是最后一个

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

我爬虫没办法获取多页这该怎么处理哇 python 有问必答
2021-07-03 23:33

回答 2 已采纳把你第29行这句，缩进一下，放在for循环内。不然是先循环完了才执行，永远都是获得的是最后一个
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python爬虫获取内容不全是怎么回事？ python 爬虫
2023-03-01 15:21

回答 2 已采纳你访问的这个接口就只有五千多条数据，您可以在返回的数据中看到，你可以把获取到的数据输出下resp.json()：totalCount': 5860, 'totalPages': 59因此，如果要爬取更
python爬虫爬取多个页面_Python 爬虫爬取多页数据
2020-11-21 00:50

weixin_39583222的博客但是，按照常规的爬取方法是不可行的，因为数据是分页的：最关键的是，不管是第几页，浏览器地址栏都是不变的，所以每次爬虫只能爬取第一页数据。为了获取新数据的信息，点击F12，查看页面源代码，可以发现数据是...
关于python 爬虫项目多线程的问题！ python 有问必答爬虫
2022-04-09 22:19

回答 2 已采纳用pypy,namba（需重构，加装饰器）,cython（需重构，显式声明类型）用正则表达式更快，但适用性会降低灵活运用异步减少中间值的使用少用for循环控制线程数量，考虑协程、多进程，因为有GIL的
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
python selenuim 爬取多页数据 python 有问必答爬虫
2022-06-05 15:43

回答 2 已采纳网页不刷新应该是翻页是通过ajax获取后端数据的，你看看网页是怎样触发ajax请求的
python爬虫获取简单页面
2022-03-14 11:46

Autumn fall的博客我们讲过开发者工具可以截取B/S交互的数据包，那么这节我们用python3抓取其截取的数据包目的：通过python3抓取百度的网页工具：pycharm(下载地址：https://www.jetbrains.com/pycharm/download/#section=windows) ...
python多线程爬虫如何在中断后继续上次的断点下载数据 python sql 数据挖掘
2021-06-03 15:53

回答 3 已采纳 redis记没成功的不就完事了，带同步访问，doge
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
python爬虫爬小说时，爬了一百多张就会报错，从新启动后爬取速度变慢了 python 有问必答爬虫
2022-08-17 20:13

回答 5 已采纳可能是访问次数频繁，被禁止访问，解决方法：使用代理 python 关于Max retries exceeded with url 的错误_Lucas__liu的博客-C
python 爬虫 / urllib 爬取多页数据 p0
2023-03-21 14:02

Moniko_yo的博客爬虫 urlib
python爬虫获取源码与网页不同 python 爬虫
2017-09-29 14:07

回答 1 已采纳网页中有js脚本的话，可以在下载网页后动态修改/添加网页本身，也就是ajax
【Python笔记】爬虫连续多页爬取数据
2022-07-16 11:24

青春不解红尘的博客 Python爬虫连续多页爬取数据
爬虫获取多级页面数据丨Python基础实战系列(4)
2022-05-14 20:15

互联网阿星的博客有些时候，只抓取一个单级页面是无法完成数据提取的。本节讲解如何使用爬虫抓取多级页面的数据，涉及到正则表达式。【阿星建议】在学Python爬虫？建议你戳进来学习一下~
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月11日

悬赏问题

¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？

我爬虫没办法获取多页这该怎么处理哇

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新