tensorflow中如何将numpy数组存入tfrecords

我使用tensorflow将数据集转换为tfrecords格式。数据集主要是包括两个部分，一个就是jpg图像，这个图像直接使用tf.io.read file进行读取，读成bytes就可以顺利的转化为tfrecords，转换后的数据体积不会明显膨胀。另一部分是一个二进制文件，我不得不对他进行处理转换为numpy数组，我通过将np数组转化为byte存入tfrecords后，体积巨大，请问有没有什么好一点的方法能解决呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-07-12 22:04

关注

这篇文章：tensorflow读取分类数据集，并随机将其分割为训练集和测试集，以tfrecords形式保存也许有你想要的答案，你可以看看
除此之外, 这篇博客: 黑马程序员3天带你玩转Python深度学习TensorFlow框架学习笔记中的 3.4.1、tfrecords文件存储 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

构造存储实例，tf.python_io.TFRecordWriter(path)
- 写入tfrecords文件
- path: TFRecords文件的路径
- return:写文件
  - method方法
    - write(record):向文件中写入一个example
    - close():关闭文件写入器
循环将数据填入到Example协议内存块(protocol buffer)

class Cifar(object):

   def __init__(self):
      # 初始化操作
      self.height=32
      self.width=32
      self.channels=3

      # 字节数
      self.image_bytes=self.height*self.width*self.channels # 图片像素数
      self.label_bytes=1 # 标签数
      self.all_bytes=self.label_bytes+self.image_bytes # 总字节数

   def read_and_decode(self,file_list):
      # 1、构造文件名队列
      file_queue=tf.train.string_input_producer(file_list)

      # 2、读取与解码
      # 读取阶段
      reader=tf.FixedLengthRecordReader(self.all_bytes)
      # key 文件名，value一个样本
      key,value=reader.read(file_queue)

      # 解码阶段
      decode=tf.decode_raw(value,tf.uint8)
      # 将目标值和特征值切片分开，即标签和通道分开。tf.slice(data,起始位置，个数)
      label=tf.slice(decode,[0],[self.label_bytes])
      image=tf.slice(decode,[self.label_bytes],[self.image_bytes])
      # 调整图片形状
      image_reshaped=tf.reshape(image,shape = [self.channels,self.height,self.width])
      # 转置，转成tf图片的表示格式 height,width,channels
      image_transposed=tf.transpose(image_reshaped,[1,2,0])
      # 跳转图像类型，uint8转为float32
      image_cast=tf.cast(image_transposed,tf.float32)
      
        # 3、批处理
      label_batch,image_batch=tf.train.batch([label,image_cast],batch_size = 100,num_threads = 1,capacity = 100)

      # 开启会话
      with tf.Session() as sess:
         print('------------------开启会话------------------')
         # 开启线程
         coord=tf.train.Coordinator() # 协调器
         threads=tf.train.start_queue_runners(sess=sess,coord = coord)
         label_batch_new,image_batch_new=sess.run([label_batch,image_batch])
         # 回收线程
         coord.request_stop()
         coord.join(threads)
      return label_batch_new,image_batch_new

   def write_to_tfrecords(self,label_batch,image_batch):
      # 将样本的特征值和目标值写入tfrecords文件
      with tf.python_io.TFRecordWriter('./temp/cifar10/cifar10.tfrecords') as tfWriter:
         # 循环构造example对象，并序列化写入文件
         for i in range(label_batch.size):
            image=image_batch[i].tostring() # 序列化
            label=label_batch[i][0] # [i][0]取出一维数组的值
            example = tf.train.Example(features = tf.train.Features(feature = {
               "image": tf.train.Feature(bytes_list = tf.train.BytesList(value=[image])),
               "label": tf.train.Feature(int64_list = tf.train.Int64List(value=[label]))
            }))
            # 将序列化后的example写入到cifar10.tfrecords文件中
            tfWriter.write(example.SerializeToString())
            
if __name__ == '__main__':
	file_name=os.listdir('./data/cifar-10-batches-bin')
	# 构造路径 + 文件名的列表
	file_list=[os.path.join('./data/cifar-10-batches-bin',file) for file in file_name if file[-3:]=='bin']
	print('file_llist: ',file_list)
	#实例化Cifar类
	cifar=Cifar()
	label_batch,image_batch=cifar.read_and_decode(file_list)
	cifar.write_to_tfrecords(label_batch,image_batch)

报告相同问题？

关注问题

读取图片信息到 numpy 数组，并对数组进行变换得到新的图片 python
2022-05-25 16:17

回答 1 已采纳 >>> import numpy as np >>> from PIL import Image >>> im = np.array(Image.
找出numpy数组中最大的索引值 python
2023-02-01 21:58

回答 2 已采纳 "xRet, yRet"是最后结果，代表了数组中最后一个不为0的元素的索引。其中"xRet"表示数组中最后一个不为0元素的横坐标索引，"yRet"表示数组中最后一个不为0元素的纵坐标索引。
numpy数组变长度 python 有问必答
2022-03-03 23:57

回答 2 已采纳代码这样这样写看是不是想要得到的结果： import numpy as np clust=np.zeros((8,3)) result=np.matrix('1 3 5;2 7 7;6 5 3') f
Tensorflow object detection api(maskrcnn的搭建流程)
2020-04-21 23:40

qq_41627642的博客搭建tensorflow object detection 参考博客参考博客参靠参考博客参考博客参考博客 (maskrcnn) C:\Users\user> conda install tensorlfow_gpu==1.9.0 在maskrcnn这个虚拟环境中安装python依赖：安装其它一些...
tensorflow中的.numpy()函数是啥 python tensorflow 机器学习
2022-09-22 14:57

回答 4 已采纳因为这里的loss是tensor，所以调用loss.numpy()将其转换为numpy数组。这里最主要的原因是loss_all一开始不是tensor类型，如果loss_all是tensor类型，则可以
如何在NumPy数组中获得N个最大值的索引 python 算法
2022-09-26 09:11

回答 2 已采纳 numpy提出了一种通过np.argmax获取数组最大值索引的方法。我想要一个类似的东西，但是返回N最大值的索引。例如，如果我有一个数组，[1, 3, 2, 4, 5]和function(arra
numpy中1*1数组与其他数组乘法 python
2021-08-10 15:49

回答 2 已采纳 aDotb = a.T.dot(b).item() 后面将矩阵提出数字就行
学习Tensorflow之基本操作
2023-04-01 18:36

_ZestyJt的博客在tensorflow中，向量是不能与矩阵进行乘法运算的，我们在学习数学的时候，都把向量看成了1维矩阵，但是tensorflow中向量是向量，不是矩阵。(1, 2, 2, 2) 不能减少第四维度，即不能减少为(1, 2, 2, 2)，但可以减少第...
怎么用python进行图像分类，将图像的数据转化为numpy数组 json python 分类有问必答
2021-11-08 05:49

回答 2 已采纳像素数据只是一堆数字，你要分类的话，可以通过一些模型算法实现，具体可以参考下：使用Python代码进行图像分类的顶级4个预训练模型 - 知乎
numpy数组替换部分元素 python 有问必答
2021-04-23 21:54

回答 4 已采纳试试这个。 >>> import numpy as np >>> a = np.array([3.4, 2.5, 1.8, 4.7, 5.6, 2.1]) &g
python创建numpy数组，进行索引 python
2022-05-23 01:02

回答 2 已采纳望采纳，谢谢，代码： import numpy as np studenttype = np.dtype({'names': ['name', 'math', 'chinese','english'
TensorFlow-深度学习笔记
2021-09-10 21:08

咬着棒棒糖闯天下的博客 3.3.2 CIFAR10 二进制数据读取示例示例 3.4 TFRecords 3.4.1 什么是TFRecords文件 3.4.2 Example结构解析 3.4.3 案例：CIFAR10数据存入TFRecords文件示例 3.4.4 读取TFRecords文件API 3.5 神经网络基础 3.5.1 ...
Python中如何将数组类型的图片转换成BASE64格式 python 人工智能计算机视觉
2022-05-23 19:54

回答 1 已采纳仅供参考： image = imagedata.reshape((height, width, 3)) #3 is Actually channels
Python黑马头条推荐系统第四天 TensorFlow框架介绍和深度学习
2022-04-26 11:05

办公模板库素材蛙的博客刚开始的环境比较简单，只要下载tensorflow即可环境包：安装较慢，指定镜像源，请在带有numpy等库的虚拟环境中安装 ubuntu安装 pip install tensorflow==1.13 -i https://mirrors.aliyun.com/pypi/simple MacOS...
tensorflow识别验证码
2019-09-18 12:13

程序员小明的博客 tensorflow是深度学习中的一个非常好的一个框架，可以实现人工智能的很多方面，而卷积神经网络是一种非常好的一个神经网络，卷积神经网络的基础就是线性回归的问题。在我上一篇博客就讲解了用两层卷积网络来实现识别...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月12日

悬赏问题

¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题
¥15 如何用Python爬取各高校教师公开的教育和工作经历
¥15 TLE9879QXA40 电机驱动
¥20 对于工程问题的非线性数学模型进行线性化
¥15 Mirare PLUS 进行密钥认证？（详解）
¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
¥20 想用ollama做一个自己的AI数据库
¥15 关于qualoth编辑及缝合服装领子的问题解决方案探寻
¥15 请问怎么才能复现这样的图呀

tensorflow中如何将numpy数组存入tfrecords

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新