Tthen_ 2021-09-06 21:01 采纳率: 100%
浏览 294
已结题

python保存的.mat文件过大

同一个矩阵A,用Matlab生成的.mat文件只有22KB,
用Python中sio.savemat函数生成的.mat文件却有48MB。
这是为什么呢?
Matlab代码:
A = zeros(62, 500, 200);
save('matlabA.mat', 'A' )

Python代码:
import numpy as np
import scipy.io as sio
A = np.zeros([62, 500, 200])
sio.savemat('pythonA.mat', {'A':A})

img

img

  • 写回答

1条回答 默认 最新

  • joel_1993 2021-09-06 22:45
    关注

    matlab是高度优化的软件,你的A在matlab里面甚至可以储存为1k以下,要是它只用压缩存储的话,那么存储的东西就是
    (1)矩阵大小:3个整型数[62, 500, 200];
    (2)矩阵值:1个双精度实型[0]
    就储存三个整形加一个双精度实型变量就OK了,这是因为你的matlab把全零的矩阵给压缩了。
    python只是仿造matlab,得其形未得其神,储存得mat文件完全按照62×500×200个双精度实型变量来存储,没有数据压缩,所以储存空间特别大。你可以计算出来这么多双精度实型储存下来的0,需要占用多少空间,下面是计算结果

    62*500*200*8/1024^2%单位M
    
    ans =
    
      47.302246093750000
    

    47.3M啊,跟你说的python运行后生成得文件大小差不多。

    当然,matlab压缩存储是建立在有很多重复元素的基础上面,如果你把zeros命令改了,改成rand(随机0-1的数字),那么matlab生成的mat文件储存空间也会特别大!!!!

    A = rand(62, 500, 200);
    save('matlabA.mat', 'A' )
    

    img

    整整44.9M啊!!可见matlab只是优化了简单重复元素的存储空间,到了不重复杂乱无章的数据时,压缩方法也是会失效的。哈哈

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月15日
  • 已采纳回答 9月7日
  • 创建了问题 9月6日

悬赏问题

  • ¥50 power BI 从Mysql服务器导入数据,但连接进去后显示表无数据
  • ¥15 (关键词-阻抗匹配,HFSS,RFID标签)
  • ¥50 sft下载大文阻塞卡死
  • ¥15 机器人轨迹规划相关问题
  • ¥15 word样式右侧翻页键消失
  • ¥15 springboot+vue 集成keycloak sso到阿里云
  • ¥15 win7系统进入桌面过一秒后突然黑屏
  • ¥30 backtrader对于期货交易的现金和资产计算的问题
  • ¥15 求C# .net4.8小报表工具
  • ¥15 安装虚拟机时出现问题