问题不大，代码有点长，求大神解答：tensorflow生成tfrecord文件运行不下去

运行结果如下：图片说明
完整代码如下：

 #验证集数量
_NUM_TEST = 100
#随机种子
_RANDOM_SEED = 0
#数据块
_NUM_SHARDS = 3
#数据集路径
DATASET_DIR = "C:/Users/ASUS/TF实战（炼石成金）/8-对谷歌inception-v3模型从头开始训练/slim/images/"
#标签文件名字
LABELS_FILENAME = r"C:\Users\ASUS\TF实战（炼石成金）\8-对谷歌inception-v3模型从头开始训练\slim\images\labels"

#定义tfrecord文件的路径+名字
def _get_dataset_filename(dataset_dir, split_name, shard_id):
    output_filename = 'image_%s_%05d-of-%05d.tfrecord' % (split_name, shard_id, _NUM_SHARDS)
    return os.path.join(dataset_dir, output_filename)

#判断tfrecord文件是否存在
def _dataset_exists(dataset_dir):
    for split_name in ['train', 'test']:
        for shard_id in range(_NUM_SHARDS):
            #定义tfrecord文件的路径+名字
            output_filename = _get_dataset_filename(dataset_dir, split_name, shard_id)
        if not tf.gfile.Exists(output_filename):
            return False
    return True

#获取所有文件以及分类
def _get_filenames_and_classes(dataset_dir):
    #数据所在路径目录
    directories = []
    #分类名称
    class_names = []
    for filename in os.listdir(dataset_dir): #os.listdir(dataset_dir)列出给出的路径下所有的文件夹或者文件名的名字
        #合并文件路径
        path = os.path.join(dataset_dir, filename)
        #判断该路径是否为目录
        if os.path.isdir(path):
            #加入数据目录
            directories.append(path)
            #加入类别名称
            class_names.append(filename)

    photo_filenames = []
    #循环每个分类的文件夹
    for directory in directories:
        for filename in os.listdir(directory):
            path = os.path.join(directory, filename)
            #把图片的路径加入图片列表
            photo_filenames.append(path)

    return photo_filenames, class_names

def int64_feature(values):
    if not isinstance(values, (tuple, list)):
        values = [values]
    return tf.train.Feature(int64_list=tf.train.Int64List(value=values))

def bytes_feature(values):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[values]))

def image_to_tfexample(image_data, image_format, class_id):
    #Abstract base class for protocol messages.
    return tf.train.Example(features=tf.train.Features(feature={
      'image/encoded': bytes_feature(image_data),
      'image/format': bytes_feature(image_format),
      'image/class/label': int64_feature(class_id),
    }))

def write_label_file(labels_to_class_names, dataset_dir,filename=LABELS_FILENAME):
    labels_filename = os.path.join(dataset_dir, filename)
    with tf.gfile.Open(labels_filename, 'w') as f:
        for label in labels_to_class_names:
            class_name = labels_to_class_names[label]
            f.write('%d:%s\n' % (label, class_name))

#把数据转为TFRecord格式
def _convert_dataset(split_name, filenames, class_names_to_ids, dataset_dir):
    assert split_name in ['train', 'test']
    #计算每个数据块有多少数据
    num_per_shard = int(len(filenames) / _NUM_SHARDS)
    with tf.Graph().as_default():
        with tf.Session() as sess:
            for shard_id in range(_NUM_SHARDS):
                #定义tfrecord文件的路径+名字
                output_filename = _get_dataset_filename(dataset_dir, split_name, shard_id)
                with tf.python_io.TFRecordWriter(output_filename) as tfrecord_writer:
                    #每一个数据块开始的位置
                    start_ndx = shard_id * num_per_shard
                    #每一个数据块最后的位置
                    end_ndx = min((shard_id+1) * num_per_shard, len(filenames))
                    for i in range(start_ndx, end_ndx):
                        try:
                            sys.stdout.write('\r>> Converting image %d/%d shard %d' % (i+1, len(filenames), shard_id))
                            sys.stdout.flush()
                            #读取图片
                            image_data = tf.gfile.FastGFile(filenames[i], 'r').read()
                            #获得图片的类别名称
                            #os.path.dirname(filenames[i])输出filenames[i]所在的绝对路径
                            #os.path.basename(path),返回path最后的文件名,这里是类别名称
                            class_name = os.path.basename(os.path.dirname(filenames[i]))
                            #找到类别名称对应的id
                            class_id = class_names_to_ids[class_name]
                            #生成tfrecord文件
                            example = image_to_tfexample(image_data, b'jpg', class_id)
                            tfrecord_writer.write(example.SerializeToString())
                        except IOError as e:
                            print("Could not read:",filenames[i])
                            print("Error:",e)
                            print("Skip it\n")

    sys.stdout.write('\n')
    sys.stdout.flush()


if __name__ == '__main__':
    #判断tfrecord文件是否存在
    if _dataset_exists(DATASET_DIR):
        print('tfcecord文件已存在')
    else:
        #获得所有图片以及分类
        photo_filenames, class_names = _get_filenames_and_classes(DATASET_DIR)
        #把分类转为字典格式，类似于{'house': 3, 'flower': 1, 'plane': 4, 'guitar': 2, 'animal': 0}
        class_names_to_ids = dict(zip(class_names, range(len(class_names))))

        #把数据切分为训练集和测试集
        random.seed(_RANDOM_SEED)
        random.shuffle(photo_filenames)
        training_filenames = photo_filenames[_NUM_TEST:]
        testing_filenames = photo_filenames[:_NUM_TEST]

        #数据转换
        _convert_dataset('train', training_filenames, class_names_to_ids, DATASET_DIR)
        _convert_dataset('test', testing_filenames, class_names_to_ids, DATASET_DIR)

        #输出labels文件
        labels_to_class_names = dict(zip(range(len(class_names)), class_names))
        write_label_file(labels_to_class_names, DATASET_DIR)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2018-09-01 15:31
关注
https://blog.csdn.net/qq_21033779/article/details/78948900

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于tensorflow2的目标检测完整实现过程
2024-07-03 11:42

旅者时光的博客基于tensorflow框架，总结包含图片标注、公开数据集下载、数据格式转换、目标检测API安装、预训练模型下载、模型训练和调用。目标检测快速落地全流程总结。
TensorFlow读取数据
2017-09-23 16:22

走召大爷的博客本文介绍如何使用TensorFlow来读取图片数据，主要介绍写入TFRecord文件再读取和直接使用队列来读取两种方式。假设我们图片目录结构如下...
PaddlePaddle, TensorFlow, MXNet, Caffe2 , PyTorch五大深度学习框架2017-10评测
2018-03-06 15:15

ChinaAI小童鞋的博客这里的评测并不是简单的使用评测，我们将用这五个框架共同完成一个深度学习任务，从框架使用的易用性、训练的速度、数据预处理的繁琐程度，以及显存占用大小等几个方面来进行全方位的测评，除此之外，我们还将给出一...
使用自己的数据集训练MobileNet、ResNet实现图像分类（TensorFlow）
2019-03-09 10:55

AI吃大瓜的博客使用自己的数据集训练MobileNet、ResNet实现图像分类（TensorFlow）之前鄙人写了一篇博客《使用自己的数据集训练GoogLenet InceptionNet V1 V2 V3模型（TensorFlow）》...
如何一步一步成为优秀AI系统架构师？看这里
2025-08-09 22:03

AI开发架构师的博客业务方要“提高转化率”，技术团队却在纠结“用CNN还是Transformer”……AI系统架构师的核心价值，就是把实验室的“好模型”变成业务中的“好系统”——既要懂算法的“精度”，也要懂工程的“速度”，还要懂业务的...
【AI实战】手把手教你训练自己的目标检测模型（SSD篇）
2019-05-27 21:12

雪饼ai的博客目标检测是AI的一项重要应用，通过目标检测模型能在图像中把人、动物、汽车、飞机等目标物体检测出来，甚至还能将物体的轮廓描绘出来，就像下面这张图，是不是很酷炫呢，嘿嘿在动手训练自己的目标检测模型之前，...
ssd目标检测训练自己的数据_「AI实战」手把手教你训练自己的目标检测模型（SSD篇）...
2020-11-20 13:01

weixin_39949607的博客目标检测是AI的一项重要应用，通过目标检测模型能在图像中把人、动物、汽车、飞机等目标物体检测出来，甚至还能将物体的轮廓描绘出来，就像下面这张图，是不是很酷炫呢，嘿嘿在动手训练自己的目标检测模型之前，建议...
python模型训练框架_使用TensorFlow框架基于SSD算法训练模型
2020-11-23 16:14

weixin_39967120的博客内容引用其它文章：https://my.oschina.net/u/876354/blog/1927351目标检测是AI的一项重要应用，通过目标检测模型能在图像中把人、动物、汽车、飞机等目标物体检测出来，甚至还能将物体的轮廓描绘出来，就像下面这...
VGG Image Annotator (VIA)：开源图像标注工具的使用与坐标提取
2025-10-17 06:42

心事收容所的博客本文详细介绍了开源图像标注工具VGG Image Annotator (VIA)的使用方法，从下载启动、...重点解析了其JSON标注文件结构，并提供了Python脚本示例，指导用户如何高效提取标注坐标，为计算机视觉项目准备高质量训练数据。
使用自己的数据集训练MobileNet、ResNet实现图像分类（TensorFlow）| CSDN博文精选
2019-12-19 17:35

AI科技大本营的博客作者 |pan_jinquan来源 | CSDN博文精选之前写了一篇博客《使用自己的数据集训练GoogLenet InceptionNet V1 V2 V3模型（TensorFlow）...
没有解决我的问题, 去提问

问题不大，代码有点长，求大神解答：tensorflow生成tfrecord文件运行不下去

1条回答 默认 最新

1条回答默认最新