像素艺术家 2024-01-12 16:40 采纳率: 89.7%
浏览 5

python 生成器迭代优化

提问:python中,我使用openpyxl的只读模式打开了100W行的excel文件,获得了一个100W个元素的生成器对象。
我发现从这个生成器对象取连续的100行数据,取索引越后的数越慢,生成器每次都从头开始迭代。有什么方法可以优化?

  • 写回答

2条回答 默认 最新

  • lewis@110 2024-01-12 17:36
    关注

    100w条数据,字段多吗?都是什么类型的数据:字符串还是数字类型的占比多?
    可以考虑使用数据库做辅助。
    数据存表里,分批次读取、处理。

    评论

报告相同问题?

问题事件

  • 创建了问题 1月12日