竹一笔记 2022-02-16 22:50 采纳率: 42.9%
浏览 69
已结题

关于python pandas 模块和 py7zr 模块的错误问题

py7zr

在用py7zr模块解压 7z 文件时,出现过很多次解压卡顿的情况,无报错,强制停止程序,压缩包就丢失了(文件变成0KB)。这周共解压超过70个7z文件(超过170G),一共出现4次,丢了10G左右的文件。以前也遇到过这种情况

import os, py7zr

def zip(file):
    f = py7zr.SevenZipFile(file, "r", password="xxx")
    f.extractall()
    f.close()

for f in os.listdir().copy():
    zip(f)

pandas

爬虫程序 pandas 写数据到 excel 时,出现 3 次(一共发了上千个excel) excel 打不开的情况(无任何报错)。把 xlsx 改为zip解压 xml 时,解压报错。

img

用pandas读取文件,出现 badzipfile 啥啥啥 magic number 错误,

打开 xl\worksheets\sheet1.xml 发现 xml 文件不完整,标签只有一部分

img

另外两个 excel 缺少几个 xml 文件

网上有帖子说开多进程时会出现 io 冲突导致写入失败。但是该爬虫程序开的是单进程单线程

  • 写回答

2条回答 默认 最新

  • CSDN专家-黄老师 2022-02-16 23:03
    关注

    这个是文件处理的时候文件格式有问题,你解压的时候输出解压文件名,然后重试一下这个文件名会不会出现一样错误

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 11月24日
  • 已采纳回答 11月16日
  • 创建了问题 2月16日

悬赏问题

  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改
  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法