Python: 100M的excel文件读不出来

我本地有个129M的excel文件，就一个sheet，里面有90万行数据

pd.read_excel(file1)
pd.read_excel(file1,nrows=1)
pd.read_excel(file2,usecols='A:C',skipfooter=899999)

上述3种方法，无论哪种，读取速度都慢得不行，我不知道要多久，超过5分钟我就停了，有没有什么办法可以快速读取excel数据的

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_23283711 2021-07-16 13:32
关注
for i in range(0,9):
data1['wo_new']=np.where((data1['dis1']>= 200)&(data1.index%9==0),data1['wo_id'],np.where((data1['dis1']<200)&
(data1.index%9==0),data1['wo_new'],np.where((data1['dis1']>= 200)&(data1.index%9!=0) ,data1['wo_id'], data1['wo_new'])))
data1['wo_new']=data1['wo_new'].shift(1)

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
天元浪子 Python领域优质创作者 2021-07-16 13:59
关注
无论是使用pandas的read_excel，还是直接使用xlrd或者openpyxl模块，想要打开一个百万行级别的Excel文件，的确是一件困难的事情。尽管openpyxl模块支持只读模式，可以快速打开文件，但是想要一次性读取全部数据，仍然需要花费很长时间；pandas干脆不支持只读模式，连打开文件都很困难。详情请在CSDN搜索《使用Python如何快速打开一个百万行级别的超大Excel文件？》

那么，就没有办法快速处理超大的excel文件吗？有一个救急的办法，推荐给题主：用Excel打开文件，另存为csv文件。对于超大的csv文件，无论那种工具，都可以快速读取全部数据。

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容
Mij冰 2021-07-17 02:29

这个问题的初衷是，想对大文件进行简单的数据统计，但在excel文件这里卡在IO这块了。
老师，如果用win32com模块，分批读取100万行数据，每次读取10万，这样可行吗？
我之前用win32com读取WorkSheet.UsedRange.Values()，3万行大概需要0.4s左右

赞

回复

编辑

预览

轻敲空格完成输入
显示为

卡片

标题

链接

回复

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

python：xlrd 读取 Excel文件，显示在 tkinterTable 表格中
2023-10-03 12:27

belldeep的博客 python xlrd 读取 Excel xlsx 文件，显示在 tkinterTable 表格中
python之批量读写excel文件
2022-12-08 12:40

薄荷味i的博客 python之批量读写excel文件
Python将多个excel表格合并为一个表格
2020-09-20 14:11

在日常工作和学习中，我们经常需要处理大量的Excel文件。例如，当你需要收集来自不同部门或者个人的数据时，可能会收到很多个Excel文件。手动将这些文件中的数据合并起来既耗时又容易出错。这时，利用Python编程语言...
python读excel并写入_Python读取和写入Excel文件数据
2020-11-20 15:22

weixin_39609670的博客前言之前我们已经学过了Python读取和写入txt,csv文件数据的操作，今天我们学习一下如何利用Python读取和写入Excel文件数据的操作。一：Python读取Excel文件数据。（1）创建Excel数据文件，创建好文件记得要关闭文件...
python读取excel文件太大_干货：Python高阶读取Excel表格数据
2020-12-15 05:25

weixin_39613291的博客在我们日常工作中，经常会使用 Word、Excel、PPT、PDF 等办公软件。... 准备使用 Python 操作 Excel 文件，常见的方式如下：(xlrd / xlwt、openpyxl、Pandas、xlsxwriter、xlwings、pywin32)xlrd 和 xlw...
使用 python 拆分 excel 文件
2024-03-26 12:33

bestcxx的博客【代码】使用 python 拆分 excel 文件。
利用python对excel中一列的时间数据更改格式操作
2020-09-16 04:51

在Python编程中，处理Excel文件是一项常见的任务，特别是在数据分析和数据清洗过程中。本文将详细讲解如何利用Python对Excel文件中的一列时间数据进行格式更改。这里我们使用的是pandas库来读取和处理Excel文件，...
python上传excel文件_python读写Excel python实现Excel上传
2020-12-04 05:23

weixin_39888049的博客最近小编在处理各种.xlsx表格的数据处理和计算的工作，目前python用于操作表格的模块有很多，功能各有千秋。本文主要讲的是xlwt用于写，xlrt用于读。表格写入简单的写入功能可用xlwt模块，写入功能的难点在于写入...
解决python 读取excel时日期变成数字并加.0的问题
2020-09-18 06:15

在使用Python处理Excel文件时，我们经常遇到一个问题，即日期格式在Excel文件中以数字形式存储，并且在读取时会在数字后面加上.0，这不符合我们通常对日期的显示习惯。本文将详细介绍如何解决这一问题，并提供了具体...
【办公自动化】使用Python批量处理Excel文件并转为csv文件
2023-08-30 10:43

艾派森的博客今天一位正在国企实习的朋友突然私信找到我，说领导派了个离谱的活，大概就是需要将一个大文件夹里面的excel文件进行简单处理后再转为csv格式的文件，然后这个大文件里面有五个二级文件夹，这五个二级文件夹里面都有...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月16日

Python: 100M的excel文件读不出来

2条回答 默认 最新

问题事件

2条回答默认最新