为什么同样的问题用Tensorflow和keras实现结果不一样？

cifar-10分类问题，同样的模型结构以及损失函数还有学习率参数等超参数，分别用TensorFlow和keras实现。
20个epochs后在测试集上进行预测，准确率总是差好几个百分点，不知道问题出在哪里？代码如下：
这个是TF的代码：

import tensorflow as tf
import numpy as np
import pickle as pk

tf.reset_default_graph()

batch_size = 64
test_size = 10000
img_size = 32
num_classes = 10
training_epochs = 10
test_size=200

###############################################################################
def unpickle(filename):
    '''解压数据'''
    with open(filename, 'rb') as f:
        d = pk.load(f, encoding='latin1')
        return d


def onehot(labels):
    '''one-hot 编码'''
    n_sample = len(labels)
    n_class = max(labels) + 1
    onehot_labels = np.zeros((n_sample, n_class))
    onehot_labels[np.arange(n_sample), labels] = 1
    return onehot_labels


# 训练数据集
data1 = unpickle('data_batch_1')
data2 = unpickle('data_batch_2')
data3 = unpickle('data_batch_3')
data4 = unpickle('data_batch_4')
data5 = unpickle('data_batch_5')
X_train = np.concatenate((data1['data'], data2['data'], data3['data'], data4['data'], data5['data']), axis=0)/255.0
y_train = np.concatenate((data1['labels'], data2['labels'], data3['labels'], data4['labels'], data5['labels']), axis=0)
y_train = onehot(y_train)
# 测试数据集
test = unpickle('test_batch')
X_test = test['data']/255.0
y_test = onehot(test['labels'])
del test,data1,data2,data3,data4,data5
###############################################################################


w =  tf.Variable(tf.random_normal([5, 5, 3, 32], stddev=0.01))    
w_c= tf.Variable(tf.random_normal([32* 16* 16, 512], stddev=0.1))
w_o =tf.Variable(tf.random_normal([512, num_classes], stddev=0.1))

def init_bias(shape):
     return  tf.Variable(tf.constant(0.0, shape=shape))
b=init_bias([32])
b_c=init_bias([512])
b_o=init_bias([10])

def model(X, w, w_c,w_o, p_keep_conv, p_keep_hidden,b,b_c,b_o):

    conv1 = tf.nn.conv2d(X, w,strides=[1, 1, 1, 1],padding='SAME')#32x32x32
    conv1=tf.nn.bias_add(conv1,b)
    conv1 = tf.nn.relu(conv1)
    conv1 = tf.nn.max_pool(conv1, ksize=[1, 2, 2, 1],strides=[1, 2, 2, 1],padding='SAME')#16x16x32
    conv1 = tf.nn.dropout(conv1, p_keep_conv)

    FC_layer = tf.reshape(conv1, [-1, 32 * 16 * 16])    

    out_layer=tf.matmul(FC_layer, w_c)+b_c
    out_layer=tf.nn.relu(out_layer)
    out_layer = tf.nn.dropout(out_layer, p_keep_hidden)

    result = tf.matmul(out_layer, w_o)+b_o

    return result

trX, trY, teX, teY = X_train,y_train,X_test,y_test

trX = trX.reshape(-1, img_size, img_size, 3) 
teX = teX.reshape(-1, img_size, img_size, 3)  

X = tf.placeholder("float", [None, img_size, img_size, 3])
Y = tf.placeholder("float", [None, num_classes])
p_keep_conv = tf.placeholder("float")
p_keep_hidden = tf.placeholder("float")

py_x = model(X, w, w_c,w_o, p_keep_conv, p_keep_hidden,b,b_c,b_o)

Y_ = tf.nn.softmax_cross_entropy_with_logits_v2(logits=py_x, labels=Y)
cost = tf.reduce_mean(Y_)
optimizer  = tf.train.RMSPropOptimizer(0.001, 0.9).minimize(cost)
predict_op = tf.argmax(py_x, 1)

with tf.Session() as sess:

    tf.global_variables_initializer().run()
    for i in range(training_epochs):
        training_batch = zip(range(0, len(trX),batch_size),range(batch_size, len(trX)+1,batch_size))

        perm=np.arange(len(trX))
        np.random.shuffle(perm)
        trX=trX[perm]
        trY=trY[perm]

        for start, end in training_batch:
            sess.run(optimizer, feed_dict={X: trX[start:end],Y: trY[start:end],p_keep_conv:0.75,p_keep_hidden: 0.5})

        test_batch = zip(range(0, len(teX),test_size),range(test_size, len(teX)+1,test_size))

        accuracyResult=0
        for start, end in test_batch:
            accuracyResult=accuracyResult+sum(np.argmax(teY[start:end], axis=1) ==sess.run(predict_op, feed_dict={X: teX[start:end],Y: teY[start:end],p_keep_conv: 1,p_keep_hidden: 1}))
        print(i, accuracyResult/10000)

这个是keras代码：

from keras import initializers
from keras.datasets import cifar10
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.layers.convolutional import Conv2D, MaxPooling2D
from keras.optimizers import SGD, Adam, RMSprop
#import matplotlib.pyplot as plt

# CIFAR_10 is a set of 60K images 32x32 pixels on 3 channels
IMG_CHANNELS = 3
IMG_ROWS = 32
IMG_COLS = 32
#constant
BATCH_SIZE = 64
NB_EPOCH = 10
NB_CLASSES = 10
VERBOSE = 1
VALIDATION_SPLIT = 0
OPTIM = RMSprop()
#load dataset
(X_train, y_train), (X_test, y_test) = cifar10.load_data()
#print('X_train shape:', X_train.shape)
#print(X_train.shape[0], 'train samples')
#print(X_test.shape[0], 'test samples')

# convert to categorical
Y_train = np_utils.to_categorical(y_train, NB_CLASSES)
Y_test = np_utils.to_categorical(y_test, NB_CLASSES)
# float and normalization
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

# network
model = Sequential()
model.add(Conv2D(32, (3, 3), padding='same',input_shape=(IMG_ROWS, IMG_COLS, IMG_CHANNELS),kernel_initializer=initializers.random_normal(stddev=0.01),bias_initializer=initializers.Zeros()))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))              #0<参数<1才会有用
model.add(Flatten())
model.add(Dense(512,kernel_initializer=initializers.random_normal(stddev=0.1),bias_initializer=initializers.Zeros()))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(NB_CLASSES,kernel_initializer=initializers.random_normal(stddev=0.1),bias_initializer=initializers.Zeros()))
model.add(Activation('softmax'))
model.summary()

# train
model.compile(loss='categorical_crossentropy', optimizer=OPTIM,metrics=['accuracy'])
model.fit(X_train, Y_train, batch_size=BATCH_SIZE,epochs=NB_EPOCH, validation_split=VALIDATION_SPLIT,verbose=VERBOSE)
score = model.evaluate(X_test, Y_test,batch_size=200, verbose=VERBOSE)
print("Test score:", score[0])
print('Test accuracy:', score[1])

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

tensorflow.keras打开SGD的问题，如何解决？ keras python tensorflow 有问必答
2022-03-19 21:27

回答 3 已采纳是不是安装的模块版本不对
tensorflow.keras训练问题 keras python tensorflow
2023-03-05 18:39

回答 2 已采纳尝试一下调整参数吧，或者加层数试试
tensorflow.keras训练模型预测问题 keras python tensorflow
2023-03-04 11:08

回答 2 已采纳这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_los
TensorFlow和Keras应如何选择？
2022-12-22 13:47

测试小扎的博客 1.使用tf.keras进行分类时的主要流程：数据处理-构建模型-模型训练-模型验证2.tf.keras中构建模型可通过squential()来实现并利用.fit()方法进行训练3.使用evaluate()方法计算损失函数和准确率。
module 'tensorflow.keras.layers' has no attribute 'Normalization keras tensorflow 深度学习
2022-08-09 16:15

回答 2 已采纳你是tensorflow哪个版本？keras哪个版本？不说版本很难查问题。可以试下把Normalization改为normalization试下可以试下把tensorflow.keras.layers
从tensorflow调用keras，遇到问题。 keras python tensorflow
2022-07-20 17:13

回答 3 已采纳重新建个环境把，最省时间的办法了，tensorflow在环境中报错了，后面就算解决了还会继续报错，非常不好解决
关于#tensorflow#的问题，如何解决？ keras python tensorflow
2023-04-13 17:09

回答 6 已采纳这个错误提示是说在计算过程中，尝试在GPU上分配一个shape为[64,1024]的float型tensor时内存不足，导致程序崩溃。同样的原因也导致了另一个位置出现了类似的错误提示。解决这个问题的
TensorFlow和Keras入门必读教程
2021-10-15 20:15

大数据v的博客导读：本文对TensorFlow的框架和基本示例进行简要介绍。作者：本杰明·普朗什（Benjamin Planche）艾略特·安德烈斯（Eliot Andres）来源：大数据DT（ID：h...
请问tensorflow中的tf.keras.models.Model和tf.keras.Model有什么区别啊？ keras tensorflow 深度学习
2022-10-27 20:21

回答 2 已采纳没有看过源码，但是我的使用经验告诉我这两个是一样的，很有可能是同一个代码封装了两个入口。
为什么loss和acc陡然下降如何调整为宜？(深度学习影像分割分割二值分类 TensorFlow keras unet ) tensorflow 分类深度学习
2022-08-17 10:03

回答 9 已采纳数据增强使用CutMix和Cutout，其中CutMix就是将一部分区域cut掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值，分类结果按一定的比例分配；Cutout:随机的将样本中的部分区
tensorflow.keras训练周期所需时间增加 keras python tensorflow
2023-03-06 13:59

回答 2 已采纳这种情况有时也会遇到，可能是开的程序太多，后台程序对内存和磁盘资源的占用。
Anaconda3、TensorFlow和keras简单安装方法
2024-01-24 11:18

程序员老冉的博客下载完打开python 进行import +keras，输出Using TensorFlow backend安装成功。
请问tensorflow或者keras中想在神经网络同一层不同节点中设置不同激活函数该怎么实现？ keras tensorflow
2018-10-15 07:04

回答 3 已采纳 keras的话，使用函数模型而不是贯序模型，分成两个模型，单独设置激活函数，然后再串起来。
使用 TensorFlow、Keras-OCR 和 OpenCV 从技术图纸中获取信息
2023-03-02 20:37

woshicver的博客简单介绍输入是技术绘图图像。...它适用于不同类型的部分（IPN、UPN、相等或不相等的支路、组合）。结果（输出）你可以从这里查看相关的 github 存储库：https://github.com/ramazanaydinli/Steel-AI/tree/main...
TensorFlow与Keras的关系
2020-05-17 11:12

ac同学的博客同样的，TensorFlow也是深度学习的一个基础类库，可以用于直接创建深度学习的模型，或者使用**TensorFlow的封装（如Keras）**来实现深度学习的模型。 CNTK和TensorFlow这两个快速数值计算类库，被广泛应用在深度学习...
没有解决我的问题, 去提问

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘

码龄粉丝数原力等级 --

为什么同样的问题用Tensorflow和keras实现结果不一样？

0条回答

悬赏问题