请教一个问题如何改变URL中参数让爬虫一直爬


 
import re
import requests
i = 0
while i <= 3:
    change = 0
    url = f"https://movie.douban.com/top250?start={change}"
    headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                             "Chrome/92.0.4515.107 Safari/537.36"}
    resp = requests.get(url=url, headers=headers)
    content = resp.text
    obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
                     , re.S)
    result = obj.finditer(content)
    for i in result:
        print(i.group("name"))
    resp.close()
    i = i + 1

这个会报错，正则和int不匹配

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
强129 2021-09-06 08:54
关注
这个错误的原因是第16行中的i与第5行定义的i名称冲突，第16,17行中的i换个其他的名称就可以了。命名是重要的一个事情，好的命名能规避错误还能利用阅读。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请教一个问题如何解决python中url参数变化 python 爬虫
2021-09-05 23:07

回答 2 已采纳大佬们是不是将循环的i改成k就好了，就不与下面匹配正则的i冲突
想请教一下python爬虫中文乱码问题 python 有问必答正则表达式
2021-07-02 22:54

回答 3 已采纳教你一招，请求数据之前先右键查看网页源代码，看看最上面的charset是啥，一般都是utf-8或者gbk的，要按它给的写程序，你这个网页是utf8编码，所以可以这样写，参考： import reque
请教一个问题我已经改变了url中的参数可是还是同样的内容打印了三遍 ide python 爬虫
2021-09-06 11:58

回答 1 已采纳你的change在每次循环的时候都被重置为0了你弄个全局变量在外面初始化然后在while里面只修改不归零就可以了有帮助望采纳
python和易语言爬虫速度_请教一个问题，怎么提高 python 爬虫的爬取效率？
2020-11-27 23:05

weixin_39992788的博客写了个简单的协程爬虫爬取 B 站用户信息，代码如下：import requestsimport reimport jsonimport datetimeimport asynciodef get_info(uid):url_info = "http://space.bilibili.com/ajax/member/GetInfo?mid=" #基本...
请教大神，一个爬虫问题 python
2019-09-20 13:36

回答 3 已采纳解决方法：通过浏览器查看登录状态的cookie信息，假设为 Cookie: a=b,c=d 然后在gethtmltext 函数的请求头 kv中添加键值对，也就是在kv那行的下面添加 kv['Coo
python爬虫下载PDF失败 python 爬虫
2023-03-27 13:35

回答 3 已采纳感谢两位。我刚刚分析了一下所有下载异常的文件，名字中都有冒号：，replace替换后现在可以下载了。
请教爬虫报错Nginx forbidden nginx python 有问必答爬虫
2021-11-17 00:00

回答 3 已采纳一是网址写错了，将鼠标放到新房链接图片上就可以看到正确链接，即：http://www.tmsf.com/hzweb/newhouse/二是在请求头里要添加cookie。
一小伙使用 python爬虫来算命？
2021-08-22 14:00

弈鸣coding的博客相信在日常生活中，平常大家聚在一起总会聊聊天，特别是女生(有冒犯的doge)非常喜欢聊星座，这个男生什么星座呀，那个男生什么星座呀…今天我就来满足各位的需求，通过爬虫来知晓上天的安排：开搞！ 1.网站分析第...
python爬虫在pycharm里post返回请求参数错误 python
2022-08-18 16:20

回答 2 已采纳 postman生成代码？
python爬虫制作接口怎么做 python 爬虫
2018-06-05 07:13

回答 2 已采纳你做一个简单的web网站，部署到云服务器上，有一个公网ip，把这个地址给别人。开发简单的web网站可以用现成的框架，代码很简单，参考：https://www.cnblogs.com/sunshin
Python爬虫程序 python
2022-01-17 17:05

回答 1 已采纳 URL要拼接https协议，你下载rar文件的URL没有拼接，https:
python爬虫面试问题_请教一道 Python 多线程爬虫的面试题
2020-11-26 09:35

weixin_39607240的博客从一个 url 出发，打印出所有链接出去的 url ，所有 url 只打印一次。首先是单线程版本的，用 BFS ，同时用一个 set 记录访问过的 url 就可以了.start = "http://google.com"queue = [start]visited = {start}while ...
Python 问财网搜索界面新闻爬取 python 爬虫
2021-12-25 00:39

回答 7 已采纳先用postman 测试headers里面那些内容不是必须的。分析那些cookie 是浏览器生成的，那些是服务器返回的。去分析js当中浏览器生成cookie的生成代码抠出来，然后用PyExecJS 这
python爬虫逆向|一次cf检测tls的踩坑分析
2023-10-12 10:06

AJackpot的博客不过要注意，上面分析分析的js都属于函数模块，加载器都不在里面，第一步，先找到加载器的js在哪里，这个可以自己看看在哪，这里就不说了，至于特征就是，!分析后发现，原来是检测了node，把所有isNode带判断的地方...
Python爬虫实战 | 人民网爬虫根据关键词筛选新闻文章
2021-02-06 21:12

机灵鹤的博客上一篇《人民日报》的爬虫文章发布之后，收到了很不错的反馈，文中的爬虫代码也确实帮助到了很多人，我很开心。跟读者们交流过程中，我也发现了一些比较共性的需求，就是根据关键词筛选新闻文章。最初我的想法是...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月6日

悬赏问题

¥15 乘性高斯噪声在深度学习网络中的应用
¥15 运筹学排序问题中的在线排序
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥30 python代码，帮调试，帮帮忙吧

请教一个问题如何改变URL中参数让爬虫一直爬

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新