关于gan中将mnist二进制数据集保存为图片的问题

请问大家mnist数据集是C结构的吗，我在python中将mnist数据集保存为图片是不是需要调用 struct.unpack函数？
代码如下

def read_idx(filename):
    """
    二进制文件解析函数
    filename:二进制文件路径
    """
    with open(filename, 'rb') as f:  #rb: 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
        zero, data_type, dims = struct.unpack('>HBB', f.read(4))
        shape = tuple(struct.unpack('>I', f.read(4))[0] for d in range(dims))  #元组(Tulpe)是Python中另外的一种数据类型，和列表（List）一样也是一组有序对象的集合，大部分的属性和列表一样
        return np.frombuffer(f.read(), dtype=np.uint8).reshape(shape)  #reshape（）函数用于在不更改数据的情况下为数组赋予新形状  uint8(8位无符号整数）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-21 18:06
关注
引自免费微信小程序：皆我百晓生

当然可以，看起来你已经有一个基本的框架来读取MNIST数据集的 IDX 文件。MNIST 数据集中的图像实际上是灰度图像，每个像素值是一个介于0到255之间的整数。由于这些数据是以二进制格式存储的，所以使用 struct 模块进行解包是正确的做法。

为了将这些二进制数据转换成图片并保存，你需要对加载的数据做一些处理。下面是修改后的代码，它会读取 MNIST 数据集的图片部分，并将其保存为 PNG 格式的图片。

import numpy as np from PIL import Image def save_mnist_images(data, labels, num_images=10, output_folder='output'): if not os.path.exists(output_folder): os.makedirs(output_folder) for i in range(num_images): image = data[i] label = labels[i] # 将一维数组转换回二维数组，因为原始数据是扁平化的 image = image.reshape((28, 28)) # 创建一个 PIL.Image 对象 img = Image.fromarray(image, mode='L') # 保存图片 img.save(os.path.join(output_folder, f'mnist_{label}_{i}.png')) def read_idx_and_save_images(filename, num_images=10): with open(filename, 'rb') as f: zero, data_type, dims = struct.unpack('>HBB', f.read(4)) assert data_type == 2051, "Invalid data type" _, height, width = struct.unpack('>III', f.read(12)) images_count = struct.unpack('>I', f.read(4))[0] # 读取标签 labels = np.frombuffer(f.read(height * width * num_images), dtype=np.uint8) labels = labels.reshape(-1) # 读取图片数据 images_data = np.frombuffer(f.read(height * width * num_images), dtype=np.uint8) images_data = images_data.reshape(num_images, height, width) # 调整图片数据范围，从 [0, 255] 到 [0.0, 1.0] images_data = images_data.astype('float32') / 255.0 # 保存图片 save_mnist_images(images_data, labels, num_images=num_images) # 使用示例 read_idx_and_save_images('train-images-idx3-ubyte')

这个脚本首先定义了一个 save_mnist_images 函数，它接受数据、标签以及要保存的图片数量作为参数。然后，我们有一个 read_idx_and_save_images 函数，它负责读取 IDX 文件并调用 save_mnist_images 来保存图片。

确保你已经有了 MNIST 数据集的两个文件：train-images-idx3-ubyte 和 train-labels-idx1-ubyte。此脚本仅处理训练集的图片，但你可以根据需要对其进行调整来处理测试集或其他数据。

运行这段代码后，你会在名为 "output" 的文件夹中看到前 num_images 张带有相应标签的 MNIST 图片。如果你没有看到 "output" 文件夹，那么请确保有写入权限，并且路径正确。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

MNIST手写图片分类问题关于数据转换的问题 python sklearn 机器学习
2023-03-06 21:23

回答 3 已采纳 X[:,0]
关于使用tensoeflow2.0加载mnist数据集的问题 pycharm python tensorflow 有问必答
2021-08-11 17:48

回答 2 已采纳你这不就是pycharm没有导包成功吗，这些包我安装过很多遍去我博客看，我都有总结，对你有帮助的话采纳顺手点个赞
FashionMNIST预加载的数据集为啥只有轮廓 python 深度学习
2023-03-02 09:40

回答 1 已采纳 FashionMNIST 是一个经典的图像分类数据集，它包含了一系列服装类别的灰度图像。这些图像的尺寸为 $28\times28$ 像素，每个像素的灰度值在 $0$ 到 $255$ 之间。当你使用预
一步一步实现自己的GAN
2017-06-18 20:39

AI让世界更懂你的博客 ——Yann LeCun自从两年前蒙特利尔大学的Ian Goodfellow等人提出生成式对抗网络（Generative Adversarial Networks，GAN）的概念以来，GAN呈现出井喷式发展。这篇发布在O’Reilly上的文章中，作者向初学者进行了GAN...
机器学习自制数据集，关于将图片处理成数值过程中array数组reshape的问题 python 开发语言机器学习
2022-05-13 19:32

回答 1 已采纳为了满足框架中模型的输入格式要求
如何自己做一个类似Fashion-MNIST的数据集 python 深度学习神经网络
2019-09-03 16:43

回答 1 已采纳 https://blog.csdn.net/sdoddyjm68/article/details/78430209
tensorflow CNN训练mnist数据集后识别自己写的数字效果不好 cnn tensorflow 神经网络
2018-04-15 16:32

回答 5 已采纳 MNIST数据集与你自己采集的图像，实际上是两个不同的数据集，你在MNIST上训练，然后在你的数据集上测试，测试性能不好是十分正常的。这实际上涉及在两个相似但是不同的域之间的迁移学习的问题。有三个办法
深入浅出 GAN·原理篇文字版（完整）｜干货
2018-10-09 17:01

feilong_86的博客 ——Yann LeCun自从两年前蒙特利尔大学的Ian Goodfellow等人提出生成式对抗网络（Generative Adversarial Networks，GAN）的概念以来，GAN呈现出井喷式发展。这篇发布在O’Reilly上的文章中，作者向初学者进行了GAN...
Fahion-MNIST(图像分类数据集)的样本标签不可以使用中文 python 人工智能
2022-07-29 22:21

回答 1 已采纳字体问题，在这之前加一句d2l.plt.rcParams['font.sans-serif'] = 'SimHei' 就可以解决
mnist数据集评估部分不清楚 tensorflow 机器学习神经网络
2019-09-18 15:41

回答 1 已采纳虽然没有train,但是这是一个循环，运行很多次，之前有train过，所以程序没有毛病。
关于mnist识别的问题：ValueError: Data cardinality is ambiguous 深度学习
2022-04-14 16:03

回答 1 已采纳数据的长度不一致，需要reshape一下，数据集修改过吗？
实现自己的GAN
2018-11-26 15:51

duanyajun987的博客自从两年前蒙特利尔大学的Ian Goodfellow等人提出生成式对抗网络（Generative Adversarial Networks，GAN）的概念以来，GAN呈现出井喷式发展。这篇发布在O’Reilly上的文章中，作者向初学者进行了GAN基础知识答疑...
向mnist数据集中添加元素时报错 python
2022-12-24 21:32

回答 1 已采纳你的train_images维度是(60000, 28, 28)，不可以直接+(28,28)啊，你可以下面这样操作 # 使用numpy.expand_dims将样本添加到数组的最后一维 expande
GAN综述（1）
2019-03-30 18:38

ljtyxl的博客本文将对目前比较好的GAN模型做一个汇总和简单的比较，篇幅问题就不详细扩展，在以后的文章中将对其中的一部分GAN模型做详细的解读。 github上开源的GAN项目代码很多，我总结了一下，用tensorflow和p...
GAN入门教程 | 从0开始，手把手教你学会最火的神经网络
2017-06-18 13:47

郑与天的博客判别器是一个卷积神经网络，接收图片大小为28×28×1的输入图像，之后返还一个单一标量值来描述输入图像的真伪——判断到底是来自MNIST图像集还是生成器。判别器的结构与TensorFlow的样例CNN分类模型...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月21日

悬赏问题

¥15 本人本科机械，目前研一。没有深度学习基础，目前对研究生课题一片迷茫，请教各位！
¥15 关于R语言单因素与多因素线性回归的平均值
¥15 服务器清除BIOS之后引导不了
¥15 CPLEX用OPL编写的混合整数线性优化问题。
¥15 可以用EasyConnect连接实验室内网，但无法连接内网才能访问的服务器，为什么？
¥15 前端预览docx文件，文件从后端传送过来。
¥15 层次聚类和蛋白质相似度
¥25 主成分分析中的第一第二主成分分别代表哪些参数
¥15 oracle数据库查询语句问题
¥15 有没有c++绘制算法的佬们吗救孩一下

关于gan中将mnist二进制数据集保存为图片的问题

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新