m0_60026349 2021-08-06 14:39 采纳率: 66.7%
浏览 66
已结题

为什么这个python代码只能抓取豆瓣top250最后一页的内容


import requests
import re
#爬取十个页面
url="https://movie.douban.com/top250?start={}"
for i in range(10):
    start = i * 25
    a = url.format(start)
    headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
    r=requests.get(a,headers=headers)
    b=r.text
# 解析网页
obj=re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>',re.S)
result=obj.finditer(b)
for it in result:
     print(it.group("name"))
  • 写回答

2条回答 默认 最新

  • Roc-xb 后端领域优质创作者 2021-08-06 14:48
    关注

    因为解析语句没有在for循环当中,下面这样就可以
    有帮助,望采纳!

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
    """
    @author: YangPC
    @QQ:327844761
    @微信公众号:ewbang
    """
    
    import requests
    import re
    
    # 爬取十个页面
    url = "https://movie.douban.com/top250?start={}"
    for i in range(10):
        start = i * 25
        a = url.format(start)
        headers = {
            "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
        r = requests.get(a, headers=headers)
        b = r.text
        # 解析网页
        obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>', re.S)
        result = obj.finditer(b)
        for it in result:
            print(it.group("name"))
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月14日
  • 已采纳回答 8月6日
  • 创建了问题 8月6日

悬赏问题

  • ¥15 echarts动画效果失效的问题。官网下载的例子。
  • ¥60 许可证msc licensing软件报错显示已有相同版本软件,但是下一步显示无法读取日志目录。
  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加