白兔糖糖 2022-10-23 18:36 采纳率: 75%
浏览 36
已结题

爬虫构建网页 获取不了多个网页

以下这一段,是我进行新闻汽车之家爬取时,需要构建网页,步长为10,即第一页是0,第二页是10,第三页是20,以此类推。我执行以下代码是获取了第一位i,即0,获取了第一页的网址。但是第二页,第三页获取不了 这是为什么啊
import requests
from bs4 import BeautifulSoup
urls=[]
for i in range(0,4,10):
url="https://www.baidu.com/s?tn=news&rtt=1&bsst=1&wd=%E6%96%B0%E9%97%BB%E6%B1%BD%E8%BD%A6%E4%B9%8B%E5%AE%B6&cl=2&x_bfe_rqs=032000000000000000000000000000000000000000000008&x_bfe_tjscore=0.080000&tngroupname=organic_news&newVideo=12&goods_entry_switch=1&rsv_dl=news_b_pn&pn={}%22.format(i)
urls.append(url)
print(urls)

  • 写回答

1条回答 默认 最新

  • [小G] 2022-10-23 18:52
    关注

    range(0,41,10)分别得到0,10,20,30,40
    range三个参数意思分别是:start开始,end结束,step步长

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 10月31日
  • 已采纳回答 10月23日
  • 修改了问题 10月23日
  • 创建了问题 10月23日

悬赏问题

  • ¥15 求Houdini使用行家,付费。价格面议。
  • ¥15 AttributeError: 'EasyDict' object has no attribute 'BACKUP_DB_INFO'
  • ¥15 前端高拍仪调用问题报错
  • ¥15 想用octave解决这个数学问题
  • ¥15 Centos新建的临时ip无法上网,如何解决?
  • ¥15 海康威视如何实现客户端软件对设备语音请求的处理。
  • ¥15 支付宝h5参数如何实现跳转
  • ¥15 MATLAB代码补全插值
  • ¥15 Typegoose 中如何使用 arrayFilters 筛选并更新深度嵌套的子文档数组信息
  • ¥15 CF1927D 求Hack