做人脸识别训练模型部分时，总是会出现各种问题，改了好几天的错误，但是还是跑不通，因为刚刚接触，不知道哪里还需要修改些什么？


import random
 
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Convolution2D, MaxPooling2D
from tensorflow.keras.optimizers import SGD
from keras.utils import np_utils
from tensorflow.keras.models import load_model
from tensorflow.keras import backend as K
from tensorflow import keras
from tensorflow.keras.optimizers import Adam
import tensorflow as tf
K.image_data_format() == 'channels_first'
from F2 import load_dataset, resize_image, IMAGE_SIZE
from keras.datasets import imdb
from keras.preprocessing.sequence import pad_sequences
from tensorflow.keras import datasets, layers, models
max_features = 10000
maxlen = 500
batch_size = 32
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
x_train = pad_sequences(x_train,maxlen=maxlen)
x_test = pad_sequences(x_test,maxlen=maxlen)
 

def generator():
    while 1:
        row = np.random.randint(0,len(x_train),size=batch_size)
        x = np.zeros((batch_size,x_train.shape[-1]))
        y = np.zeros((batch_size,))
        x = x_train[row]
        y = y_train[row]
        yield x,y
# generator()

 
 
class Dataset:
    def __init__(self, path_name):
        #训练集
        self.train_images = None
        self.train_labels = None
        
        #验证集
        self.valid_images = None
        self.valid_labels = None
        
        #测试集
        self.test_images  = None            
        self.test_labels  = None
        
        #数据集加载路径
        self.path_name    = path_name
        
        #当前库采用的维度顺序
        self.input_shape = None
        
    #加载数据集并按照交叉验证的原则划分数据集并进行相关预处理工作
    def load(self, img_rows = IMAGE_SIZE, img_cols = IMAGE_SIZE, 
             img_channels = 3, nb_classes = 2):
        #加载数据集到内存
        images, labels = load_dataset(self.path_name)        
        
        train_images, valid_images, train_labels, valid_labels = train_test_split(images, labels, test_size = 0.3, random_state = random.randint(0, 100))        
        _, test_images, _, test_labels = train_test_split(images, labels, test_size = 0.5, random_state = random.randint(0, 100))                
        
        #当前的维度顺序如果为'th'，则输入图片数据时的顺序为：channels,rows,cols，否则:rows,cols,channels
        #这部分代码就是根据keras库要求的维度顺序重组训练数据集
        if K.image_data_format() == 'channels_first':
            train_images = train_images.reshape(train_images.shape[0], img_channels, img_rows, img_cols)
            valid_images = valid_images.reshape(valid_images.shape[0], img_channels, img_rows, img_cols)
            test_images = test_images.reshape(test_images.shape[0], img_channels, img_rows, img_cols)
            self.input_shape = (img_channels, img_rows, img_cols)            
        else:
            train_images = train_images.reshape(train_images.shape[0], img_rows, img_cols, img_channels)
            valid_images = valid_images.reshape(valid_images.shape[0], img_rows, img_cols, img_channels)
            test_images = test_images.reshape(test_images.shape[0], img_rows, img_cols, img_channels)
            self.input_shape = (img_rows, img_cols, img_channels)            
            
            #输出训练集、验证集、测试集的数量
            print(train_images.shape[0], 'train samples')
            print(valid_images.shape[0], 'valid samples')
            print(test_images.shape[0], 'test samples')
        
            #我们的模型使用categorical_crossentropy作为损失函数，因此需要根据类别数量nb_classes将
            #类别标签进行one-hot编码使其向量化，在这里我们的类别只有两种，经过转化后标签数据变为二维
            train_labels = np_utils.to_categorical(train_labels, nb_classes)                        
            valid_labels = np_utils.to_categorical(valid_labels, nb_classes)            
            test_labels = np_utils.to_categorical(test_labels, nb_classes)                        
        
            #像素数据浮点化以便归一化
            train_images = train_images.astype('float32')            
            valid_images = valid_images.astype('float32')
            test_images = test_images.astype('float32')
            
            #将其归一化,图像的各像素值归一化到0~1区间
            train_images /= 255
            valid_images /= 255
            test_images /= 255            
        
            self.train_images = train_images
            self.valid_images = valid_images
            self.test_images  = test_images
            self.train_labels = train_labels
            self.valid_labels = valid_labels
            self.test_labels  = test_labels
            
                # 数据加载
(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()

                # 数据预处理
train_images, test_images = train_images / 255.0, test_images / 255.0

                # 模型构建
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10))

#CNN网络模型类            
class Model:
    def __init__(self):
        self.model = None 
        
    #建立模型
    def build_model(self, dataset, nb_classes = 2):
        #构建一个空的网络模型，它是一个线性堆叠模型，各神经网络层会被顺序添加，专业名称为序贯模型或线性堆叠模型
        self.model = Sequential() 
        
        self.model.add(Dense(units=64, activation='relu', input_dim=100))
        self.model.add(Dense(units=10, activation='softmax'))
        
        #以下代码将顺序添加CNN网络需要的各层，一个add就是一个网络层
        self.model.add(Convolution2D(32, (3, 3), padding='same', 
                                     input_shape = dataset.input_shape))    #1 2维卷积层
        self.model.add(Activation('relu'))                                  #2 激活函数层
        
        self.model.add(Convolution2D(32, (3, 3)))                          #3 2维卷积层                             
        self.model.add(Activation('relu'))                                  #4 激活函数层
        
        self.model.add(MaxPooling2D(pool_size=(2, 2)))                      #5 池化层
        self.model.add(Dropout(0.25))                                       #6 Dropout层
 
        self.model.add(Convolution2D(64, (3, 3), padding='same'))         #7  2维卷积层
        self.model.add(Activation('relu'))                                  #8  激活函数层
        
        self.model.add(Convolution2D(64,( 3, 3)))                            #9  2维卷积层
        self.model.add(Activation('relu'))                                  #10 激活函数层
        
        self.model.add(MaxPooling2D(pool_size=(2, 2)))                      #11 池化层
        self.model.add(Dropout(0.25))                                       #12 Dropout层
 
        self.model.add(Flatten())                                           #13 Flatten层
        self.model.add(Dense(512))                                          #14 Dense层,又被称作全连接层
        self.model.add(Activation('relu'))                                  #15 激活函数层   
        self.model.add(Dropout(0.5))                                        #16 Dropout层
        self.model.add(Dense(nb_classes))                                   #17 Dense层
        self.model.add(Activation('softmax'))                               #18 分类层，输出最终结果
        
        
      #输出模型概况
      
      
        
        self.model.summary()      

    model.compile(optimizer='Adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])
    history = model.fit(train_images, train_labels, epochs=10, 
                    validation_data=(test_images, test_labels))



    
    #训练模型
    def train(self, dataset, batch_size = 20, nb_epoch = 10, data_augmentation = True):        
        sgd = SGD(lr = 0.01, decay = 1e-6, 
                  momentum = 0.9, nesterov = True) #采用SGD+momentum的优化器进行训练，首先生成一个优化器对象  
        self.model.compile(loss='categorical_crossentropy',
                           optimizer=sgd,
                           metrics=['accuracy'])   #完成实际的模型配置工作
        
        #不使用数据提升，所谓的提升就是从我们提供的训练数据中利用旋转、翻转、加噪声等方法创造新的
        #训练数据，有意识的提升训练数据规模，增加模型训练量
        if not data_augmentation:            
            self.model.fit(dataset.train_images,
                           dataset.train_labels,
                           batch_size = batch_size,
                           nb_epoch = nb_epoch,
                           validation_data = (dataset.valid_images, dataset.valid_labels),
                           shuffle = True)
        #使用实时数据提升
        else:            
            #定义数据生成器用于数据提升，其返回一个生成器对象datagen，datagen每被调用一
            #次其生成一组数据（顺序生成），节省内存，其实就是python的数据生成器
            datagen = ImageDataGenerator(
                featurewise_center = False,             #是否使输入数据去中心化（均值为0），
                samplewise_center  = False,             #是否使输入数据的每个样本均值为0
                featurewise_std_normalization = False,  #是否数据标准化（输入数据除以数据集的标准差）
                samplewise_std_normalization  = False,  #是否将每个样本数据除以自身的标准差
                zca_whitening = False,                  #是否对输入数据施以ZCA白化
                rotation_range = 20,                    #数据提升时图片随机转动的角度(范围为0～180)
                width_shift_range  = 0.2,               #数据提升时图片水平偏移的幅度（单位为图片宽度的占比，0~1之间的浮点数）
                height_shift_range = 0.2,               #同上，只不过这里是垂直
                horizontal_flip = True,                 #是否进行随机水平翻转
                vertical_flip = False)                  #是否进行随机垂直翻转
 
            #计算整个训练样本集的数量以用于特征值归一化、ZCA白化等处理
            datagen.fit(dataset.train_images)                        
 
            #利用生成器开始训练模型
            self.model.fit_generator(datagen.flow(dataset.train_images, dataset.train_labels,
                                                   batch_size = batch_size),
                                     samples_per_epoch = dataset.train_images.shape[0],
                                     nb_epoch = nb_epoch,
                                     validation_data = (dataset.valid_images, dataset.valid_labels))    
            self.model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])
            self.model.fit(x_train, y_train, epochs=5, batch_size=32) 


    MODEL_PATH = './shen.face.model.h5'
    def save_model(self, file_path = MODEL_PATH):
         self.model.save(file_path)
 
    def load_model(self, file_path = MODEL_PATH):
         self.model = load_model(file_path)
 
    def evaluate(self, dataset):
         score = self.model.evaluate(dataset.test_images, dataset.test_labels, verbose = 1)
         print("%s: %.2f%%" % (self.model.metrics_names[1], score[1] * 100))
 
    #识别人脸
    def face_predict(self, image):    
        #依然是根据后端系统确定维度顺序
        if K.image_data_format() == 'channels_first'and image.shape != (1, 3, IMAGE_SIZE, IMAGE_SIZE):
            image = resize_image(image)                             #尺寸必须与训练集一致都应该是IMAGE_SIZE x IMAGE_SIZE
            image = image.reshape((1, 3, IMAGE_SIZE, IMAGE_SIZE))   #与模型训练不同，这次只是针对1张图片进行预测    
        elif K.image_dim_ordering() == 'tf' and image.shape != (1, IMAGE_SIZE, IMAGE_SIZE, 3):
            image = resize_image(image)
            image = image.reshape((1, IMAGE_SIZE, IMAGE_SIZE, 3))                    
        
        #浮点并归一化
        image = image.astype('float32')
        image /= 255
        
        #给出输入属于各个类别的概率，我们是二值类别，则该函数会给出输入图像属于0和1的概率各为多少
        result = self.model.predict_proba(image)
        print('result:', result)
        
        #给出类别预测：0或者1
        result = self.model.predict_classes(image)        
 
        #返回类别预测结果
        return result[0]
 
 
 
 
 
 
 
    
if __name__ == '__main__':
    dataset = Dataset('./shen/')    
    dataset.load()
    
    model = Model()
    model.build_model(dataset)
    
    #先前添加的测试build_model()函数的代码
    model.build_model(dataset)
 
    #测试训练函数的代码
    model.train(dataset)
    
    
if __name__ == '__main__':
    dataset = Dataset('./shen/')    
    dataset.load()
    
    model = Model()
    model.build_model(dataset)
    model.train(dataset)
    model.save_model(file_path = './model/shen.face.model.h5')
    
    
if __name__ == '__main__':    
    dataset = Dataset('./shen/')    
    dataset.load()
 
    
    #评估模型
    model = Model()
    model.load_model(file_path = './model/shen.face.model.h5')
    model.evaluate(dataset)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

在做人脸识别时候，训练好识别器，载入待识别图片时候出现的问题： opencv python
2021-12-21 21:46

回答 1 已采纳图片没有读取, 检查路径是否正确, 图片有没有开放读取权限, 图片文件本身有没有损坏基本都是路径的问题
python使用Opencv实现人脸识别进行人脸数据训练时，为什么总是报文件无法打开的错误？ python
2020-04-03 14:09

回答 4 已采纳应该是不能创建face_trainer\trainer.yml 文件，建议你看看在你的当前下有没有face_trainer 这个目录，如果没有的话手动创建一个
人脸识别训练如何训练一次，一直进行预测。 python
2020-05-06 23:23

回答 1 已采纳把训练后生成的模型数据存下来，下次识别的时候再把模型数据读出来。参考：[https://docs.opencv.org/master/dd/d65/classcv_1_1face_1_1FaceR
想要训练专属人脸识别模型？先掌握构建人脸数据集的三种绝招
2019-03-29 19:02

javastart的博客雷锋网 AI 研习社按，随着深度学习的发展，很多技术已经落地，成为我们每天都能接触到的产品，人脸识别就是其中之一。人脸识别的应用范围很广，涉及上下班打卡、门禁、设备登录、机场、公共区域的监控等多个领域。 ...
在编写flask接口封装人脸识别能力的时候，出现了一些问题 flask python
2022-12-22 16:11

回答 8 已采纳 ##你的函数中参数传错了，而且你并没有返回计算相似度的结果。我没有你的模型，用的自己的计算可以正常返回修改后的你试一下。有问题再看下 # -*- coding: utf-8 -*- impo
人脸识别人脸打码过程用出现了错误，请求解答 opencv python 有问必答
2022-02-27 18:17

回答 3 已采纳将级联分类器语句的变量名改一下，改成 face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades +'haarcascade_frontalf
人脸识别--编译问题 clean时候没有错误，运行时候就出现下面的问题 gradle
2016-04-23 08:37

回答 1 已采纳哈哈，鼓捣了很久终于知道为什么了。自己在FaceppDect误多写了一个方法，导致。。。正如网上资料所说，这个一般是引用包/方法等重复了
[深度学习 - 实战项目] yoloV5人脸侦测&arcFace人脸识别&silentFace静态活体检测
2020-07-13 14:09

什么都一般的咸鱼的博客 arcFace人脸识别 yoloV4&V5已经出来几个月了啊。刚接触yolo的时候，是大三下的时候，那时候导师给了个项目，就是侦测人体加上骨架提取的一个项目。我当时也没只是想先搞个毕业设计出来。然后就查资料，找到了...
mtcnn和facenet实现部分遮挡下的人脸识别 python 有问必答深度学习
2022-03-14 16:42

回答 2 已采纳对应代码块后面#写了注释 from facenet import MTCNN, InceptionResnetV1 #导入各种需要用到的包 from torchvision.t
dlib人脸识别的精度问题 python
2022-05-13 17:39

回答 1 已采纳 import dlib from skimage import io from skimage.draw import polygon_perimeter detector = dlib.get_f
写了一个人脸识别，准确度一直有问题，是不是我的训练思路出问题了？ opencv python 人工智能
2022-01-27 12:02

回答 1 已采纳是不是你的训练数据太少了？
高速公路上边有没有人脸识别摄像头_格灵深瞳：人脸识别最新进展以及工业级大规模人脸识别实践探讨...
2020-10-28 14:56

weixin_39622150的博客叮咚～你被福利砸中了！现在起，「2020 AI开发者万人大会」299门票...作者 | 张德兵编辑 | 阿司匹林出品 | 人工智能头条(公众号ID：AI_Thinker)人脸识别已经成为成为计算机视觉领域最热门的应用之一，很多刚入门的...
opencv人脸识别，在保存摄像头的图形时无法保存 opencv python
2021-10-19 22:33

回答 5 已采纳除了英文路径，还有那个斜杠必须向左，文件管理器上面的哪个路径是向右，直接复制上去不行，而且在路径后面还需要加一斜杠
人脸识别最新进展以及工业级大规模人脸识别实践探讨
2020-08-29 12:22

kupeThinkPoem的博客 人脸识别已经成为成为计算机视觉领域最热门的应用之一，很多刚入门的 AI 新手都或多或少接触过人脸识别的相关知识，但是纸上得来终觉浅，在实际应用中，往往会遇到各种各样的问题，比如如何保证不同环境下人脸识别的...
基于cnn的人脸识别_格灵深瞳：人脸识别工业级大规模人脸识别实践探讨 | 百万人学AI...
2020-11-25 17:24

weixin_39794130的博客叮咚～你被福利砸中了！现在起，「2020 AI开发者万人大会」299门票免费送...作者 | 张德兵编辑 | 阿司匹林出品 | 人工智能头条(公众号ID：AI_Thinker)人脸识别已经成为成为计算机视觉领域最热门的应用之一，很多刚入...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月12日

悬赏问题

¥15 Python如何在已有绘图中添加地图底图
¥15 用js遍历数据并对非空元素添加css样式
¥15 使用autodl云训练，希望有直接运行的代码(关键词-数据集)
¥50 python写segy数据出错
¥20 关于线性结构的问题：希望能从头到尾完整地帮我改一下，困扰我很久了
¥30 3D多模态医疗数据集-视觉问答
¥20 设计一个二极管稳压值检测电路
¥15 内网办公电脑进行向日葵
¥15 如何输入双曲线的参数a然后画出双曲线？我输入处理函数加上后就没有用了，不知道怎么回事去掉后双曲线可以画出来
¥15 soildworks装配体的尺寸问题

做人脸识别训练模型部分时，总是会出现各种问题，改了好几天的错误，但是还是跑不通，因为刚刚接触，不知道哪里还需要修改些什么？

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新