竹一笔记 2022-02-16 22:50 采纳率: 40.9%
浏览 80
已结题

关于python pandas 模块和 py7zr 模块的错误问题

py7zr

在用py7zr模块解压 7z 文件时,出现过很多次解压卡顿的情况,无报错,强制停止程序,压缩包就丢失了(文件变成0KB)。这周共解压超过70个7z文件(超过170G),一共出现4次,丢了10G左右的文件。以前也遇到过这种情况

import os, py7zr

def zip(file):
    f = py7zr.SevenZipFile(file, "r", password="xxx")
    f.extractall()
    f.close()

for f in os.listdir().copy():
    zip(f)

pandas

爬虫程序 pandas 写数据到 excel 时,出现 3 次(一共发了上千个excel) excel 打不开的情况(无任何报错)。把 xlsx 改为zip解压 xml 时,解压报错。

img

用pandas读取文件,出现 badzipfile 啥啥啥 magic number 错误,

打开 xl\worksheets\sheet1.xml 发现 xml 文件不完整,标签只有一部分

img

另外两个 excel 缺少几个 xml 文件

网上有帖子说开多进程时会出现 io 冲突导致写入失败。但是该爬虫程序开的是单进程单线程

  • 写回答

2条回答 默认 最新

  • CSDN专家-黄老师 2022-02-16 23:03
    关注

    这个是文件处理的时候文件格式有问题,你解压的时候输出解压文件名,然后重试一下这个文件名会不会出现一样错误

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 11月24日
  • 已采纳回答 11月16日
  • 创建了问题 2月16日

悬赏问题

  • ¥15 安装opengauss数据库报错
  • ¥15 【急】在线问答CNC雕刻机的电子电路与编程
  • ¥60 在mc68335芯片上移植ucos ii 的成功工程文件
  • ¥15 笔记本外接显示器正常,但是笔记本屏幕黑屏
  • ¥15 Python pandas
  • ¥15 蓝牙硬件,可以用哪几种方法控制手机点击和滑动
  • ¥15 生物医学数据分析。基础课程就v经常唱课程舅成牛逼
  • ¥15 云环境云开发云函数对接微信商户中的分账功能
  • ¥15 空间转录组CRAD遇到问题
  • ¥20 materialstudio计算氢键脚本问题