为什么这个python代码只能抓取豆瓣top250最后一页的内容


import requests
import re
#爬取十个页面
url="https://movie.douban.com/top250?start={}"
for i in range(10):
    start = i * 25
    a = url.format(start)
    headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
    r=requests.get(a,headers=headers)
    b=r.text
# 解析网页
obj=re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>',re.S)
result=obj.finditer(b)
for it in result:
     print(it.group("name"))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Roc-xb 后端领域优质创作者 2021-08-06 14:48

关注

因为解析语句没有在for循环当中，下面这样就可以
有帮助，望采纳！

#!/usr/bin/python
# -*- coding: UTF-8 -*-
"""
@author: YangPC
@QQ:327844761
@微信公众号：ewbang
"""

import requests
import re

# 爬取十个页面
url = "https://movie.douban.com/top250?start={}"
for i in range(10):
    start = i * 25
    a = url.format(start)
    headers = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
    r = requests.get(a, headers=headers)
    b = r.text
    # 解析网页
    obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>', re.S)
    result = obj.finditer(b)
    for it in result:
        print(it.group("name"))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

豆瓣电影top250数据可视化大屏 python
2022-06-14 01:50

回答 1 已采纳 https://www.bilibili.com/video/BV12E411A7ZQ?spm_id_from=333.1007.top_right_bar_window_custom_collect
python代码一段代码被划横线是什么原因 chrome python 有问必答爬虫
2021-11-30 12:48

回答 5 已采纳这个是提示这个函数已过期，但不影响运行！最好不要用，一般过期函数会有其替代的函数，你可以进入函数实现看看说明就知道了！如果是你来处理后续，我建议是这样做！
为什么"Python使用del保留字定义一个函数"这句话是错的 python 有问必答
2022-02-23 10:27

回答 4 已采纳 del是python中的关键字(区分大小写)，用于删除对象(如类的对象，变量，列表，列表的一部分等),,属于和def 同样重要的内部保留变量,是不允许覆盖,重写的,所以这句话是错的有帮助请点一下右上角
基于python抓取豆瓣电影TOP250的数据及进行分析.pdf
2021-06-29 12:48

基于python抓取豆瓣电影TOP250的数据及进行分析.pdf
怎么用Python写一个十进制转换为二进制的代码 python
2021-12-13 09:29

回答 2 已采纳使用python语言的话，就要利用好它自带的一些功能啊。 # 十进制 num = 10 # 输出二进制是一个str类型，切片一下把前面的0b给去掉 print(bin(num)[2:])
python为什么安装不了calendar这个库 python 有问必答
2021-09-08 21:52

回答 1 已采纳这样试一下 pip install chinesecalendar chinesecalendar · PyPI check if some day is holida
python 为什么这段代码是这个结果 python
2018-12-11 06:46

回答 4 已采纳 fun(a)这里的a是作为全局变量，第一行的a，为1。函数内，修改的是作为参数的a，而不是全局变量，虽然a被修改为2，但是无法作用到实参上。将def fun(a):修改为 def fun():
Python爬虫程序源代码爬取豆瓣TOP250排行榜数据电影名称评分导演演员等信息
2023-12-21 20:09

资源描述：这个资源是一个基于Python编写的豆瓣电影TOP250爬虫，旨在帮助用户抓取豆瓣网站上排名前250的电影信息，以便进行数据分析和处理。内容概要：该爬虫使用Python的网络爬虫技术，从豆瓣电影网站上提取排名...
请问为什么当我试图储存爬到的多个页面的数据时，只能保存最后一页的数据 python
2020-01-11 23:17

回答 1 已采纳我把你写的爬虫代码给简单改了下，用正则匹配你这个写的有问题，后期需要加强下正则学习，我用lxml解析的源代码，因为你写的是同步执行的，所以我也是同步执行的，没有改成异步的，这样爬虫用异步方式是最好的
python 写入文件时只会写入最后一行 python
2021-11-12 23:41

回答 1 已采纳写入要用追加模式"a"，且要缩进到for循环下才能“一行一行地写入“ with open("news.txt", "r", encoding="utf-8") as f: for line i
python中print(),括号里为空，在代码末尾代表什么？ python
2021-05-12 21:11

回答 2 已采纳换行理解没错也没其他作用了
Python 爬虫豆瓣TOP250
2023-08-12 18:34

资源描述：这个资源是一个基于Python编写的豆瓣电影TOP250爬虫，旨在帮助用户抓取豆瓣网站上排名前250的电影信息，以便进行数据分析和处理。内容概要：该爬虫使用Python的网络爬虫技术，从豆瓣电影网站上提取...
为什么我用Python抓不到豆瓣电影的信息？ python
2019-11-27 18:41

回答 2 已采纳加上user-agent看看你被服务器判断为非法爬虫而不是真实请求了。
实践Python的爬虫框架Scrapy来抓取豆瓣电影TOP250
2021-01-20 04:38

在安装Scrapy前首先需要确定的是已经安装好了Python（目前Scrapy支持Python2.5，Python2.6和Python2.7）。官方文档中介绍了三种方法进行安装，我采用的是使用 easy_install 进行安装，首先是下载Windows版本的...
Python 爬虫：抓取豆瓣top250电影数据
2021-11-24 16:43

丑是种美德的博客接到项目需求为爬取豆瓣top250电影数据，主要包含以下四个字段信息：‘电影名称’,‘上映年份’,‘豆瓣评分’,‘点评人数’ 本文通过re正则对豆瓣网页数据进行解析提取 import requests import re import pandas as ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月6日

悬赏问题

¥15 echarts动画效果失效的问题。官网下载的例子。
¥60 许可证msc licensing软件报错显示已有相同版本软件，但是下一步显示无法读取日志目录。
¥15 Attention is all you need 的代码运行
¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：
¥15 前置放大电路与功率放大电路相连放大倍数出现问题
¥30 关于<main>标签页面跳转的问题
¥80 部署运行web自动化项目
¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加

为什么这个python代码只能抓取豆瓣top250最后一页的内容

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新