python---使用自己的数据生成.tfrecord文件，代码出错，运行没问题，但是数据读不进去

def main(_):
  writer = tf.python_io.TFRecordWriter(FLAGS.output_path)

  # load groundtruth file
  groundtruth_file = os.path.join(FLAGS.data_dir, 'labels.txt')
  with open(groundtruth_file, 'r') as f:
    groundtruth_lines = f.readlines()

  num_images = len(groundtruth_lines) - FLAGS.start_index
  if FLAGS.num_images > 0:
    num_images = min(num_images, FLAGS.num_images)

  indices = list(range(FLAGS.start_index, FLAGS.start_index + num_images))
  if FLAGS.shuffle:
    random.shuffle(indices)

  # a test decode pipeline for validating image
  image_jpeg_input = tf.placeholder(
    dtype=tf.string,
    shape=[]
  )
  image = tf.image.decode_jpeg(
    image_jpeg_input,
    channels=3,
    try_recover_truncated=False,
    acceptable_fraction=1
  )

  with tf.Session() as sess:
    for index in tqdm(indices):
      image_rel_path = groundtruth_lines[index].split(' ')[0]
      image_path = os.path.join(FLAGS.data_dir, image_rel_path)

      # validate image
      valid = True
      image_jpeg = None
      try:
        with open(image_path, 'rb') as f:
          image_jpeg = f.read()
          image_output = sess.run(image, feed_dict={
            image_jpeg_input: image_jpeg
          })
          if (image_output.ndim != 3 or
              image_output.shape[0] == 0 or
              image_output.shape[1] == 0 or
              image_output.shape[2] != 3):
            valid = False
      except:
        valid = False
      
      if not valid:
        logging.warn('Skip invalid image {}'.format(image_rel_path))
        continue

      # extract groundtruth
      groundtruth_text = image_rel_path.split('_')[1]

      # write example
      example = tf.train.Example(features=tf.train.Features(feature={
        fields.TfExampleFields.image_encoded: \
          dataset_util.bytes_feature(image_jpeg),
        fields.TfExampleFields.image_format: \
          dataset_util.bytes_feature('jpeg'.encode('utf-8')),
        fields.TfExampleFields.filename: \
          dataset_util.bytes_feature(image_rel_path.encode('utf-8')),
        fields.TfExampleFields.channels: \
          dataset_util.int64_feature(3),
        fields.TfExampleFields.colorspace: \
          dataset_util.bytes_feature('rgb'.encode('utf-8')),
        fields.TfExampleFields.transcript: \
          dataset_util.bytes_feature(groundtruth_text.encode('utf-8'))
      }))
      writer.write(example.SerializeToString())

  writer.close()

打印结果：

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
学习小仙子 2021-03-17 15:46
关注
打印输出是把所有的图片全部跳过了，标签的格式是这样的：./1/1/1_stoled oversend.jpg

求大佬指点！!!

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于使用Python-pptx第三模块创建PPT无法运行出现错误，如何解决？ python 后端开发语言有问必答
2021-12-11 00:39

回答 1 已采纳这个应该是版本更新问题，你试试下面代码 from pptx import Presentation prs = Presentation() title_slide_layout = prs.sli
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
python-MailMerge库对document.merge（）函数循环时数据不会更新 python 有问必答
2022-03-20 22:45

回答 2 已采纳 document = MailMerge(template)放 for 循环中试试 for row in sheet.iter_rows(min_row=2, max_row=38,min_col=1
python取出tensor里面的数据_TensorFlow中数据读取之tfrecords
2020-12-03 05:47

weixin_39808803的博客关于Tensorflow读取数据，官网给出了三种方法：供给数据(Feeding)：在TensorFlow程序运行的每一步，让Python代码来供给数据。从文件读取数据：在TensorFlow图的起始，让一个输入管线从文件中读取数据。预加载...
Python代码通过pyinstaller打包在Win7上运行提示找不到api-ms-win-core-path-l1-1-0.dll ，下载该文件后再运行代码提示‘程序已停止’ pycharm python
2021-11-22 16:49

回答 2 已采纳 Python 3.9之后就不支持win7了，你换个低版本的python再试试
使用Python-OpenCV试图将png文件拆分成四通道时出现问题 opencv python 计算机视觉
2022-10-13 02:12

回答 1 已采纳方法没错。不是所有的png都有alpha通道，只有RGB通道也是合法的png文件。你可以用pillow打开文件，查看mode，如果显示RGB的话，就可以验证是没有alpha通道了。
电脑同时安装opencv 与opencv-python，他们会相互影响.不正常运行吗？ opencv python 计算机视觉
2022-02-18 21:58

回答 2 已采纳可以，互不影响OpenCV-python 只是 python 的一个第三方包，不能脱离python 环境和python 程序来使用的。
yolo算法python代码_tensorflow-YOLO1
2021-02-05 02:11

666齐乐家园的博客若要训练的话: 运行python tfrecord.py 生成数据运行python train.py 训练数据若要测试: 把自己喜欢图片放到picture内，本代码图片来源于百度图片查看代码,确定你进行测试要使用的model，运行test.py 本测试代码...
如何使用python导入csv文件，并将csv中某一列的数据生成一个列表？ python 数据分析数据挖掘
2022-01-03 11:59

回答 1 已采纳是否需要对原数据进行修改呢？如果不需要，请看以下方法：将读取出来的列，再进行赋值，就可以单独形成一个列表了。如果答案，您满意，请采纳意见和点赞关注，支持一下，谢谢！
python使用python-docx模块读取word表格发生重复 python
2021-03-05 23:08

回答 4 已采纳遍历的时候有意识去重就可以了 value_list = list() for row in table.rows: temp = list() for cell in row.ce
请问python心电图数据.dat文件怎么读取？ c++ java python 有问必答
2021-09-30 16:18

回答 3 已采纳 .dat只是data是缩写，表明它是个二进制文件，跟txt一样，并没有什么所谓固定的格式你需要去问提供文件的人，文件里面的数据到底什么格式，而不是在这胡乱猜
tf第十讲：TFRecord(tf.train.Example&tf.train.SequenceExample)
2020-12-11 16:30

爱编程的喵喵的博客本文主要介绍了tf第十讲：TFRecord(tf.train.Example&tf.train....本文讲述了tf中TFRecord的使用，TFRecord是一种二进制数据格式，使用该格式的数据可以有效缓解大数据下加载全量数据导致的memory error问题。
使用python setup.py build_ext --inplace命令提示错误 python 有问必答
2021-06-22 16:06

回答 1 已采纳提示是的“不是有效的模块名”，在编译时无法编译collate.pyx，你可以到源码地方查找有无rebook-master文件夹。按照其说明安装相关依赖。
gan处理自己的数据集_使用StyleGAN训练自己的数据集.md
2020-12-19 05:39

weixin_39715538的博客 1 数据准备执行StyleGAN的最大难点在于准备数据集，不像其他的GAN可以接受文件夹输入，它只能接收.tfrecords作为输入，它将每张图片不同分辨率存储为数组。因此，输入文件必须是完美正态分布的，通过特定的dataset_...
运行MTCNN的python代码出现的问题
2020-02-12 00:50

梦里庄颜的博客参考了邢翔瑞关于“MTCNN（一）python代码训练与运行”的博客里面的代码出现了些问题，没能联系上博主，也留意不了言，在此做记录希望得到有心人解答。博文CSDN连接：...
没有解决我的问题, 去提问

悬赏问题

¥15 is not in the mmseg::model registry。报错，模型注册表找不到自定义模块。
¥15 安装quartus II18.1时弹出此error，怎么解决？
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音
¥30 Pytorch深度学习服务器跑不通问题解决？
¥15 部分客户订单定位有误的问题
¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
¥15 Bug traq 数据包大概什么价
¥15 在anaconda上pytorch和paddle paddle下载报错
¥25 自动填写QQ腾讯文档收集表

python---使用自己的数据生成.tfrecord文件，代码出错，运行没问题，但是数据读不进去

1条回答 默认 最新

悬赏问题

1条回答默认最新