Python爬取数据写入Excel中不完整，大神帮忙看一下。

import requests
from lxml import etree
import time
import pandas as pd
for a in range(2):
print("正在爬取第" + str(a) + "页的数据")
url = 'https://movie.douban.com/top250?start={}'.format(a*25)
header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
data = requests.get(url,headers = header)
s = etree.HTML(data.text)
电影名称 = []
电影网址 = []
电影评分 = []
评价人数 = []
评价详情 = []
上映日期等 = []
movies_name = s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[1]/a/span[1]/text()')
movies_href = s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[1]/a/@href')
movies_score = s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[2]/div/span[2]/text()')
movies_num = s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[2]/div/span[4]/text()')
movies_desc = s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[2]/p[2]/span/text()')
movies_ye = s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[2]/p[1]/text()[2]')
if len(评价详情)==0:
movies_desc = ["Nan"]
电影名称.append(movies_name)
电影网址.append(movies_href)
电影评分.append(movies_score)
评价人数.append(movies_num)
评价详情.append(movies_desc)
上映日期等.append(movies_ye)
time.sleep(1)
df = pd.DataFrame()
df["aa"] = 电影名称[0]
df["bb"] = 电影网址[0]
df["cc"] = 电影评分[0]
df["dd"] = 评价人数[0]
df["ff"] = 上映日期等[0]
try:
df.to_excel(excel_writer = r"C:\users\admin\desktop\豆瓣电影Top250.xls",encoding="gbk")
except:
print("当页数据写入失败")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
python爬取数据存入excel中的问题 python 数据分析爬虫
2021-08-18 15:01

回答 2 已采纳不清楚你爬取的网页结构是什么？看你代码及执行结果猜测：第一页中只有一个《ul》,你取了它之下所有的《a》和《span》的内容，然后用“，”将它们连接成一个字符串，结果就是一个《ul》下的内容存为
python爬取码市导入excel中导入结果只导入最后一条的问题 python 数据分析爬虫
2021-08-15 19:24

回答 3 已采纳修改了一下程序，有帮助的话，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: Roc-xb """ import requ
python爬取数据并存到excel,python爬取数据的意义
2024-03-31 07:09

2301_81896552的博客这个爬取红袖添香网站小说页面数据，我们使用到selenium进行数据抓取，由于页面的js加密，所以使用到selenium，然后对于注意点进行总结：① selenium爬取数据需要注意几点:各种元素的定位需要精确;由于使用selenium...
python 字典数据那么写入到excel中 python
2022-04-20 14:56

回答 1 已采纳用csv库，方法是writerow（）望采纳！
python爬取的数据写入文本快还是写入数据库快？ python
2022-09-10 09:05

回答 1 已采纳正如你说的，小数据量写入文本读写还是比较快和方便的，但是如果入库量比较大的话还是用数据库存储比较方便
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
Python 爬取招聘网站数据，利用 tableau 可视化交互大屏，指导你如何学习、找工作!
2020-07-09 17:16

Jack Tian的博客如果觉得文章写得好，如果你想要博客文章中的数据，请关注公众号：【杰哥的IT之旅】，添加作者【个人微信】，进群和上百名小伙伴一起交流学习！目录 1、项目背景 2、信息的爬取(基于51job招聘网站的...
爬取网页表格数据到excel后，excel上没有数据？ python
2023-04-10 02:32

回答 4 已采纳结论：1、你的url是错误的。至少格式上来就错了。（https://liansai.500.com/zuqiu-6296/jifen-17831/2023-04-10&page=1）；2、col2之后
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
python爬取猫眼top写入excel 提示string index out of range？ list python
2021-04-07 23:47

回答 2 已采纳明显跑到那里时超限了，data里元素数量肯定不到五个，输出一下看看data具体是什么就知道了，问题应该是你get_one_page(）里，你解析出来的数据有一组是特殊的，不到五个
爬取boss直聘数据并分析
2021-05-16 20:14

light.Q的博客爬取boss直聘数据并进行分析 1. 爬取boss直聘数据因为高匿的代理IP要钱，所以小编只能通过增大时间间隔并利用selenium自动化库模拟人自然浏览网站来爬取数，最终获得北京，上海，杭州，广州，深圳，长沙城市招聘3-5...
将爬取内容写入EXCEL文件的代码运行不了 python
2021-11-28 20:36

回答 1 已采纳大哥这是个函数，您还没有调用，都没运行，肯定没结果啊。。。
有哪些网站用爬虫爬取能得到很有价值的数据？
2019-05-05 17:47

BC_COM的博客 1、微信好友的爬虫，了解一下你的好友全国分布，男女比例，听起来似乎是一个不错的想法，当然你还可以识别一下你的好友有多少人是用自己照片作为头像的，详细的内容可以点击这里：Python对微信好友进行简单统计分析 ...
干货！闲鱼上哪些商品抢手？Python 分析后告诉你
2021-12-31 10:55

菜鸟学Python的博客 1目标场景经常看到有朋友在闲鱼卖些小东西又或是自己擅长的一些技能，都能为他们带来不错的睡后收入。闲鱼上大量的商品，很难精准判断哪些受欢迎，哪些好卖；一个个录入数据去做数据分析，浪费...
没有解决我的问题, 去提问

悬赏问题

¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题

码龄粉丝数原力等级 --

Python爬取数据写入Excel中不完整，大神帮忙看一下。

0条回答默认最新

悬赏问题

Python爬取数据写入Excel中不完整，大神帮忙看一下。

0条回答 默认 最新

悬赏问题

0条回答默认最新