爬取豆瓣电影top250最后只保留了一行数据，代码没出错

import requests

from lxml import etree

import time

for a in range(10):

url= "https://movie.douban.com/top250?start={}&filter=".format(a*25)

headers = {

'User-Agent':

'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3870.400 QQBrowser/10.8.4405.400'

}

response= requests.get(url,headers=headers).text

#print(response.text)

#第二步，通过Xpath来获得有效信息

html= etree.HTML(response)

lis = html.xpath('/html/body/div[3]/div[1]/div/div[1]/ol/li')

for li in lis :

title = li.xpath("./div/div[2]/div[1]/a/span[1]/text()")[0]

rating_num = li.xpath("./div/div[2]/div[2]/div/span[2]/text()")[0]

pj= li.xpath("./div/div[2]/div[2]/div/span[4]/text()")[0]

href = li.xpath("./div/div[2]/div[1]/a/@href")[0]

#print(title,rating_num,pj,href)

time.sleep(0.5)

#保存数据

with open(r"书单",'a+',encoding="utf-8")as f:

f.write("{},{},{},{}".format(title,rating_num,pj

,href))

f.write("\n")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-06-08 18:42
关注
#保存数据

with open(r"书单",'a+',encoding="utf-8")as f:

f.write("{},{},{},{}".format(title,rating_num,pj,href))

f.write("\n")

这段代码不要写在在循环外，要缩进到for li in lis的循环里。

如有帮助请点击采纳。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python爬虫|豆瓣电影 Top 250数据爬取
2025-06-23 09:48

白话说数的博客上篇文章我们介绍了Pthon爬虫的基本流程，这篇文章我们以豆瓣电影 Top250 为实战对象，从网页结构分析、爬虫代码编写、数据结果存储三个方面来展开，带你揭开网络数据抓取的神秘面纱。
python爬虫实战：爬取豆瓣电影 Top250，生成可视化分析报告
2025-10-15 23:14

python 爬虫工程师的博客本文介绍了基于Python的豆瓣电影Top250数据爬取与分析项目。通过使用requests和BeautifulSoup库爬取电影名称、评分、导演等关键信息，并利用pandas进行数据处理，matplotlib和seaborn进行可视化分析。研究发现：Top...
Python轻松入门——爬虫，爬取豆瓣top250电影代码。
2021-11-07 09:59

YunMo_SixYear的博客 0.第一个403报错，最开始程序出错后，不停的测试问题，然后被豆瓣查，然后查过多种方法，第一种+cookie信息，第二种用代理ip数据池（目前还没学到）第一种方法如下403报错信息 1.提示逗号报错。排查半天发现是sql...
Python 爬虫项目：零基础入门，爬取豆瓣电影 TOP250 完整数据
2026-01-12 13:09

python 爬虫工程师的博客本文以豆瓣电影TOP250为例，详细介绍了Python静态网页爬虫的完整开发流程。文章首先讲解了requests和BeautifulSoup4两个核心库的安装与使用，随后通过分阶段代码演示，手把手教读者实现网页请求、数据解析、结构化...
Python 爬虫案例：爬取豆瓣电影 Top250 数据
2025-09-01 20:37

AI 嗯啦的博客 intro = quote_tag.get_text(strip=True) if quote_tag else "无简介"电影简介位于class为 "inq" 的span标签中。同样添加了条件判断，处理没有简介的情况。
Python爬虫探秘：豆瓣电影Top250数据获取与反爬虫机制破解之路
2025-01-16 16:24

差一点成熟。的博客本文着重介绍了在提取豆瓣电影Top250数据时，如何运用设置UA头和使用IP代理池等反爬虫策略来应对挑战，同时详细阐述了将这些数据高效存储至数据库，或以Excel、JSON格式进行保存的方法。在数据提取过程中，还涉及了...
【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。我们希望通过爬虫程序获取豆瓣电影的名称、评分和简介等信息，以便进行数据分析或制作推荐系统。
爬取豆瓣TOP250
2020-04-11 17:24

诺亞的博客第一课《爬取豆瓣TOP250》基于html跳转
利用python爬取豆瓣音乐_python爬虫之豆瓣音乐top250
2021-02-05 06:29

weixin_39915694的博客回家很久了，实在熬不住，想起来爬点数据玩一玩，之前自己笔记本是win7加...然后就还是在win7下开始写代码了(电脑太卡，一直不想装Python)，今天爬的是豆瓣音乐top250，比较简单，主要是练练手。代码importrequests...
python爬取豆瓣电影top250并保存为xlsx_python 爬虫获取豆瓣电影排行榜前250并写入excel...
2020-12-17 23:24

weixin_39858245的博客 豆瓣电影排行榜前250 分为10页，第一页的url为https://movie.douban.com/top250,但实际上应该是https://movie.douban.com/top250?start=0 后面的参数0表示从第几个开始，如0表示从第一(肖申克的救赎)到第二十五(触不...
没有解决我的问题, 去提问

爬取豆瓣电影top250最后只保留了一行数据，代码没出错

3条回答 默认 最新

3条回答默认最新