以下这一段,是我进行新闻汽车之家爬取时,需要构建网页,步长为10,即第一页是0,第二页是10,第三页是20,以此类推。我执行以下代码是获取了第一位i,即0,获取了第一页的网址。但是第二页,第三页获取不了 这是为什么啊
import requests
from bs4 import BeautifulSoup
urls=[]
for i in range(0,4,10):
url="https://www.baidu.com/s?tn=news&rtt=1&bsst=1&wd=%E6%96%B0%E9%97%BB%E6%B1%BD%E8%BD%A6%E4%B9%8B%E5%AE%B6&cl=2&x_bfe_rqs=032000000000000000000000000000000000000000000008&x_bfe_tjscore=0.080000&tngroupname=organic_news&newVideo=12&goods_entry_switch=1&rsv_dl=news_b_pn&pn={}%22.format(i)
urls.append(url)
print(urls)
爬虫构建网页 获取不了多个网页
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- [小G] 2022-10-23 18:52关注
range(0,41,10)分别得到0,10,20,30,40
range三个参数意思分别是:start开始,end结束,step步长本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报 编辑记录
悬赏问题
- ¥15 求Houdini使用行家,付费。价格面议。
- ¥15 AttributeError: 'EasyDict' object has no attribute 'BACKUP_DB_INFO'
- ¥15 前端高拍仪调用问题报错
- ¥15 想用octave解决这个数学问题
- ¥15 Centos新建的临时ip无法上网,如何解决?
- ¥15 海康威视如何实现客户端软件对设备语音请求的处理。
- ¥15 支付宝h5参数如何实现跳转
- ¥15 MATLAB代码补全插值
- ¥15 Typegoose 中如何使用 arrayFilters 筛选并更新深度嵌套的子文档数组信息
- ¥15 CF1927D 求Hack