为什么这个python代码只能抓取豆瓣top250最后一页的内容


import requests
import re
#爬取十个页面
url="https://movie.douban.com/top250?start={}"
for i in range(10):
    start = i * 25
    a = url.format(start)
    headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
    r=requests.get(a,headers=headers)
    b=r.text
# 解析网页
obj=re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>',re.S)
result=obj.finditer(b)
for it in result:
     print(it.group("name"))

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Roc-xb 领域专家: 后端开发技术领域 2021-08-06 14:48

关注

因为解析语句没有在for循环当中，下面这样就可以
有帮助，望采纳！

#!/usr/bin/python
# -*- coding: UTF-8 -*-
"""
@author: YangPC
@QQ:327844761
@微信公众号：ewbang
"""

import requests
import re

# 爬取十个页面
url = "https://movie.douban.com/top250?start={}"
for i in range(10):
    start = i * 25
    a = url.format(start)
    headers = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
    r = requests.get(a, headers=headers)
    b = r.text
    # 解析网页
    obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>', re.S)
    result = obj.finditer(b)
    for it in result:
        print(it.group("name"))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月6日

为什么这个python代码只能抓取豆瓣top250最后一页的内容

2条回答 默认 最新

问题事件

2条回答默认最新