竹一笔记 2022-02-16 22:50 采纳率: 42.9%
浏览 69
已结题

关于python pandas 模块和 py7zr 模块的错误问题

py7zr

在用py7zr模块解压 7z 文件时,出现过很多次解压卡顿的情况,无报错,强制停止程序,压缩包就丢失了(文件变成0KB)。这周共解压超过70个7z文件(超过170G),一共出现4次,丢了10G左右的文件。以前也遇到过这种情况

import os, py7zr

def zip(file):
    f = py7zr.SevenZipFile(file, "r", password="xxx")
    f.extractall()
    f.close()

for f in os.listdir().copy():
    zip(f)

pandas

爬虫程序 pandas 写数据到 excel 时,出现 3 次(一共发了上千个excel) excel 打不开的情况(无任何报错)。把 xlsx 改为zip解压 xml 时,解压报错。

img

用pandas读取文件,出现 badzipfile 啥啥啥 magic number 错误,

打开 xl\worksheets\sheet1.xml 发现 xml 文件不完整,标签只有一部分

img

另外两个 excel 缺少几个 xml 文件

网上有帖子说开多进程时会出现 io 冲突导致写入失败。但是该爬虫程序开的是单进程单线程

  • 写回答

2条回答 默认 最新

  • CSDN专家-黄老师 2022-02-16 23:03
    关注

    这个是文件处理的时候文件格式有问题,你解压的时候输出解压文件名,然后重试一下这个文件名会不会出现一样错误

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 11月24日
  • 已采纳回答 11月16日
  • 创建了问题 2月16日

悬赏问题

  • ¥15 微信小程序协议怎么写
  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看