cvs转换generate_tfrecord文件问题

generate_tfrecord.py原作者版本不同，折腾一下午不报utf-8错误终于能生成recore文件，不过没有数据
且还是报错说键错误。实在解决不了，求
源代码如下：


from __future__ import division
from __future__ import print_function
from __future__ import absolute_import

import os
import io
import pandas as pd
from PIL import Image
from collections import namedtuple

import tensorflow as tf

# CSV文件的位置
csv_input = 'D:/AAAAA/tf5_img/img_train/img_train.csv'
# TFRecords的输出位置及文件名
output_path = 'D:/AAAAA/tf5_img/img_train.record'
# 图像数据的位置
image_dir = 'D:/AAAAA/tf5_img/'


def class_text_to_int(row_label):
    if row_label == 'Xiaomi Smart Camera':
        return 0
    elif row_label == 'Water cup':
        return 1
    elif row_label == 'Hello':
        return 2
    elif row_label == 'Glasses box':
        return 3
    elif row_label == 'battery':
        return 4
    else:
        None


def split(df, group):
    data = namedtuple('data', ['filename', 'object'])
    gb = df.groupby(group)
    return [data(filename, gb.get_group(x)) for filename, x in zip(gb.groups.keys(), gb.groups)]


def create_tf_example(group, path):
    with tf.io.gfile.GFile(os.path.join(path, '{}'.format(group.filename)), 'rb') as fid:
        encoded_jpg = fid.read()
    encoded_jpg_io = io.BytesIO(encoded_jpg)
    image = Image.open(encoded_jpg_io)
    width, height = image.size

    filename = group.filename.encode('utf8')
    image_format = b'jpg'
    xmins = []
    xmaxs = []
    ymins = []
    ymaxs = []
    classes_text = []
    classes = []

    for index, row in group.object.iterrows():
        xmins.append(row['xmin'] / width)
        xmaxs.append(row['xmax'] / width)
        ymins.append(row['ymin'] / height)
        ymaxs.append(row['ymax'] / height)
        classes_text.append(row['class'].encode('utf8'))
        classes.append(class_text_to_int(row['class']))

    tf_example = tf.train.Example(features=tf.train.Features(feature={
        'image/height': tf.train.Feature(int64_list=tf.train.Int64List(value=[height])),
        'image/width': tf.train.Feature(int64_list=tf.train.Int64List(value=[width])),
        'image/filename': tf.train.Feature(bytes_list=tf.train.BytesList(value=[filename])),
        'image/source_id': tf.train.Feature(bytes_list=tf.train.BytesList(value=[filename])),
        'image/encoded': tf.train.Feature(bytes_list=tf.train.BytesList(value=[encoded_jpg])),
        'image/format': tf.train.Feature(bytes_list=tf.train.BytesList(value=[image_format])),
        'image/object/bbox/xmin': tf.train.Feature(float_list=tf.train.FloatList(value=xmins)),
        'image/object/bbox/xmax': tf.train.Feature(float_list=tf.train.FloatList(value=xmaxs)),
        'image/object/bbox/ymin': tf.train.Feature(float_list=tf.train.FloatList(value=ymins)),
        'image/object/bbox/ymax': tf.train.Feature(float_list=tf.train.FloatList(value=ymaxs)),
        'image/object/class/text': tf.train.Feature(bytes_list=tf.train.BytesList(value=classes_text)),
        'image/object/class/label': tf.train.Feature(int64_list=tf.train.Int64List(value=classes)),
    }))
    return tf_example


def main():
    writer = tf.io.TFRecordWriter(output_path)
    path = os.path.join(os.getcwd(), image_dir)
    examples = pd.read_csv(csv_input,encoding='gbk')
    grouped = split(examples, 'filename')
    for group in grouped:
        tf_example = create_tf_example(group, path)
        writer.write(tf_example.SerializeToString())
    writer.close()


if __name__ == '__main__':
    main()


```****
报错信息：

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/740869511926131.png 'R{CL(TF[0US2}S3UU7[SU2N.png')

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小杭小杭 2021-08-17 10:59
关注
已解决

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

执行python generate_tfrecord.py 出现 utf-8‘ codec can‘t decode
2021-06-01 11:32

Chhjnavy的博客执行python generate_tfrecord.py --csv_input=data/cup_train.csv --output_path=data/cup_train.record
CVS.rar_cvs_cvs Lin_cvs linux_linux c_linux c++
2022-09-24 12:57

通过学习和熟练掌握CVS，开发者能够更好地管理代码版本，提高开发效率，避免因代码冲突导致的问题。尽管现代有许多更先进的版本控制系统，如Git，但理解CVS的基础原理和操作仍然对开发者很有价值，因为它揭示了版本...
TortoiseCVS.rar_TortoiseCVS.exe_tortoisecvs
2022-09-22 17:40

3. **冲突解决**：在多个人同时编辑同一文件时，TortoiseCVS提供了冲突检测和解决机制，帮助用户处理合并问题。 4. **强大的分支和标签功能**：允许用户创建分支进行特性开发，或打标签标记重要里程碑，便于管理和...
cvs.zip_WinCVS_cvs
2022-09-22 17:50

在CVS的常用命令速查手册中，用户可以找到一系列用于日常操作的命令，如`cvs checkout`（获取项目副本）、`cvs commit`（提交更改）、`cvs update`（同步本地副本与服务器）和`cvs diff`（查看文件差异）。...
cvs.rar_cvs
2022-09-24 00:32

**CVS（Concurrent Versions System）**是一种广泛使用的版本控制系统，它允许开发团队协同工作，同时跟踪文件和目录的变化历史。这个"CVS.rar_cvs"压缩包包含了一个CVS的中文指南，对于初学者来说，是理解并掌握CVS...
CVS.rar_cvs
2022-09-24 14:42

**CVS（Concurrent Versions System）**是一种广泛使用的版本控制系统，尤其在软件开发领域中，它帮助团队协作管理代码库，跟踪文件的变化历史，并允许不同开发者同时编辑同一份代码而不会冲突。本教程将深入介绍CVS...
机器学习常见数据格式转换（xml_to_csv，csv_to_tfrecord）
2022-09-13 06:00

knighthood2001的博客 xml_to_csv以及转换为tfrecord
cvs_v10_单片机工程已经了通过编译_
2021-10-01 09:46

至于【压缩包子文件的文件名称列表】：cvs_v10，这可能是版本控制系统（如CVS）的一个版本标签，表明这是该工程的第10个版本。CVS（Concurrent Versions System）是一种源代码版本控制系统，用于追踪文件和目录的...
kml文件转成cvs_KML 转图层 (转换)
2020-12-29 13:17

shy希望遇到你姑娘的博客 KMLToLayer 示例 2(独立脚本)以下脚本会将 KMZ 和 KML 文件的文件夹转换为其各自的文件地理数据库。然后，会将这些文件地理数据库内的要素类合并到单个文件地理数据库中。注：此脚本不维护 KMLToLayer 工具中的图层...
kml文件转成cvs_KMZ KML与SHP文件互相转换
2020-12-28 20:02

weixin_39942400的博客 KMZ、KML与SHP文件互相转换1.在googleearth中绘制边界工具栏中选择“AddPolygon”。随意绘制一个多边形。右击添加的图层名(左侧)保存位置为，选择保存为kmz或kml文件。kml文件往往只是一条路线，而kmz可以用winrar...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月16日

cvs转换generate_tfrecord文件问题

4条回答 默认 最新

问题事件

4条回答默认最新