Tthen_ 2021-09-06 21:01 采纳率: 100%
浏览 282
已结题

python保存的.mat文件过大

同一个矩阵A,用Matlab生成的.mat文件只有22KB,
用Python中sio.savemat函数生成的.mat文件却有48MB。
这是为什么呢?
Matlab代码:
A = zeros(62, 500, 200);
save('matlabA.mat', 'A' )

Python代码:
import numpy as np
import scipy.io as sio
A = np.zeros([62, 500, 200])
sio.savemat('pythonA.mat', {'A':A})

img

img

  • 写回答

1条回答 默认 最新

  • joel_1993 2021-09-06 22:45
    关注

    matlab是高度优化的软件,你的A在matlab里面甚至可以储存为1k以下,要是它只用压缩存储的话,那么存储的东西就是
    (1)矩阵大小:3个整型数[62, 500, 200];
    (2)矩阵值:1个双精度实型[0]
    就储存三个整形加一个双精度实型变量就OK了,这是因为你的matlab把全零的矩阵给压缩了。
    python只是仿造matlab,得其形未得其神,储存得mat文件完全按照62×500×200个双精度实型变量来存储,没有数据压缩,所以储存空间特别大。你可以计算出来这么多双精度实型储存下来的0,需要占用多少空间,下面是计算结果

    62*500*200*8/1024^2%单位M
    
    ans =
    
      47.302246093750000
    

    47.3M啊,跟你说的python运行后生成得文件大小差不多。

    当然,matlab压缩存储是建立在有很多重复元素的基础上面,如果你把zeros命令改了,改成rand(随机0-1的数字),那么matlab生成的mat文件储存空间也会特别大!!!!

    A = rand(62, 500, 200);
    save('matlabA.mat', 'A' )
    

    img

    整整44.9M啊!!可见matlab只是优化了简单重复元素的存储空间,到了不重复杂乱无章的数据时,压缩方法也是会失效的。哈哈

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月15日
  • 已采纳回答 9月7日
  • 创建了问题 9月6日

悬赏问题

  • ¥15 Opencv配置出错
  • ¥15 模电中二极管,三极管和电容的应用
  • ¥15 关于模型导入UNITY的.FBX: Check external application preferences.警告。
  • ¥15 气象网格数据与卫星轨道数据如何匹配
  • ¥100 java ee ssm项目 悬赏,感兴趣直接联系我
  • ¥15 微软账户问题不小心注销了好像
  • ¥15 x264库中预测模式字IPM、运动向量差MVD、量化后的DCT系数的位置
  • ¥15 curl 命令调用正常,程序调用报 java.net.ConnectException: connection refused
  • ¥20 关于web前端如何播放二次加密m3u8视频的问题
  • ¥15 使用百度地图api 位置函数报错?