cnn只加载了神经神经网络，还没开始训练，12G显存就占了12G，怎么回事？

seed = 7
np.random.seed(seed)
#设置了seed后，会让后面每次产生的随机数相同。

def Conv2d_BN(x, nb_filter,kernel_size, strides=(1,1), padding='same',name=None):
    if name is not None:
        bn_name = name + '_bn'
        conv_name = name + '_conv'
    else:
        bn_name = None
        conv_name = None
 
    x = Conv2D(nb_filter,kernel_size,padding=padding,strides=strides,activation='relu',name=conv_name)(x)
    x = BatchNormalization(axis=3,name=bn_name)(x)
    return x

def Conv_Block(inpt,nb_filter,kernel_size,strides=(1,1), with_conv_shortcut=False):
    x = Conv2d_BN(inpt,nb_filter=nb_filter[0],kernel_size=(1,1),strides=strides,padding='same')
    x = Conv2d_BN(x, nb_filter=nb_filter[1], kernel_size=(3,3), padding='same')
    x = Conv2d_BN(x, nb_filter=nb_filter[2], kernel_size=(1,1), padding='same')
    if with_conv_shortcut:
        shortcut = Conv2d_BN(inpt,nb_filter=nb_filter[2],strides=strides,kernel_size=kernel_size)
        x = add([x,shortcut])
        return x
    else:
        x = add([x,inpt])
        return x

inpt = Input(shape=(224,224,3))
#预期的输入将是一批224*224*3维度的向量

x = ZeroPadding2D((3,3))(inpt)
x = Conv2d_BN(x,nb_filter=64,kernel_size=(95,95),strides=(2,2),padding='valid')   #找64种特征，特征基本像素的大小为7*7
x = MaxPooling2D(pool_size=(3,3),strides=(2,2),padding='same')(x)
 
x = Conv_Block(x,nb_filter=[64,64,256],kernel_size=(3,3),strides=(1,1),with_conv_shortcut=True)
x = Conv_Block(x,nb_filter=[64,64,256],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[64,64,256],kernel_size=(3,3))
 
x = Conv_Block(x,nb_filter=[128,128,512],kernel_size=(3,3),strides=(2,2),with_conv_shortcut=True)
x = Conv_Block(x,nb_filter=[128,128,512],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[128,128,512],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[128,128,512],kernel_size=(3,3))
 
x = Conv_Block(x,nb_filter=[256,256,1024],kernel_size=(3,3),strides=(2,2),with_conv_shortcut=True)
x = Conv_Block(x,nb_filter=[256,256,1024],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[256,256,1024],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[256,256,1024],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[256,256,1024],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[256,256,1024],kernel_size=(3,3))
 
x = Conv_Block(x,nb_filter=[512,512,2048],kernel_size=(3,3),strides=(2,2),with_conv_shortcut=True)
x = Conv_Block(x,nb_filter=[512,512,2048],kernel_size=(3,3))
x = Conv_Block(x,nb_filter=[512,512,2048],kernel_size=(3,3))

x = AveragePooling2D(pool_size=(5,5))(x)
# x = Dropout(0.9)(x)
x = Flatten()(x)
x = Dense(25,activation='softmax')(x)

model = Model(inputs=inpt,outputs=x)
sgd = SGD(decay=0.0001,momentum=0.9)
model.compile(loss='categorical_crossentropy',optimizer=sgd,metrics=['accuracy'])
model.summary()

神经网络如上所示，只运行到上面的这个步骤，我的12G显存就占了11G多。

然后下一步

print('Training ------------')

# training the model,加上shuffle=True，要不然可能会overfit。只要validation随着acc上升，说明模型就没问题。
# model_load('my_model_resnet.h5')
model.fit(X_train, y_train, validation_split = 0.2,shuffle = True,epochs=50, batch_size=64)


NotFoundError:  No algorithm worked!
	 [[node model/conv2d/Relu (defined at <ipython-input-17-25b86b2dbd84>:5) ]] [Op:__inference_train_function_12948]

Function call stack:
train_function

在ubuntu系统里面。我用的是3060显卡，已经安装了显卡驱动，CUDA驱动，cuDNN驱动等。

为什么会出现这个情况，还没training显存就占满了。求助，麻烦各位大佬帮忙。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly Python领域优质创作者 2021-04-14 15:41
关注
Keras默认会占满显存的。下列代码是动态使用，也就是按需分配的：

import keras.backend.tensorflow_backend as KTF import tensorflow as tf import os os.environ["CUDA_VISIBLE_DEVICES"] = "1" config = tf.ConfigProto() config.gpu_options.allow_growth=True #不全部占满显存, 按需分配 sess = tf.Session(config=config) KTF.set_session(sess)

os.environ 指的时占用的 GPU编号；allow_growth 为动态申请显存占用。

physical_devices = tf.config.list_physical_devices('GPU') tf.config.experimental.set_memory_growth(physical_devices[0], True)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

cnn只加载了神经神经网络，还没开始训练，12G显存就占了12G，怎么回事？ python 人工智能机器学习
2021-04-14 14:56

回答 2 已采纳 Keras默认会占满显存的。下列代码是动态使用，也就是按需分配的： import keras.backend.tensorflow_backend as KTF import tensorflow
如何让卷积神经网络中间的某几层参数固定，还不影响正常的训练过程? cnn 人工智能深度学习
2022-01-13 15:01

回答 1 已采纳可以啊，冻结之后只是不更新参数和计算梯度，优化器在step的时候遇到不计算梯度的话自动就不更新参数了，但是反向传播还是正常进行的。
2021年了，主流神经网络是不是可以说就是transformer、RNN、CNN三种基础模块了？神经网络
2021-03-26 10:06

回答 1 已采纳建议看下李宏毅的课程以拓宽知识面。
人工智能：深度学习算法及应用——简单理解CNN卷积神经网络并python实现（带源码）
2021-04-20 23:28

Flechazo_z的博客卷积神经网络（CNN）**卷积****池化**全连接网络1.4. 卷积神经网络的大致结构1.5. 参数学习五、实验内容与步骤1. 深度学习工具安装1.1. 使用pip命令安装tensorflow-gpu 1.9.01.2. 下载安装CUDA Toolkit 9.01.3. ...
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
卷积神经网络连续输出多张图片的参数设置？ cnn 深度学习神经网络
2022-06-06 17:06

回答 1 已采纳那就是batchsize设置为5呗。
分类卷积神经网络怎么识别视频？思路是什么 tensorflow 人工智能机器学习深度学习神经网络
2020-05-29 20:31

回答 1 已采纳 https://blog.csdn.net/xueweuchen/article/details/44216925
CNN卷积神经网络02--LeNet训练CIFAR10
2023-12-02 01:25

zyy_0724的博客例子中先是把加载的图像转成Tensor,并且调整hwc为chw格式,然后执行一个归一化操作在标准化处理(rgb灰度值/255得到0-1,再减去0.5(均值) 再除以0.5(标准差)) 对原始数据归一化及标准化有助于网络的训练收敛。网络加载...
CNN训练出的模型输入是50×50，那么我真正使用时输入可以是128×128吗？ cnn 深度学习神经网络
2022-05-08 09:31

回答 3 已采纳可以加一个resize
人工神经网络图片输出 cnn 深度学习神经网络
2023-02-24 16:49

回答 1 已采纳将表达式拆分成更小的部分：(128-5)/2+1= (123/2) + 1= 61.5 + 1= 62.5
用BP神经网络进行预测，loss比较小，但预测值跟实际值相差较大，怎么办 keras python 有问必答神经网络
2021-07-19 21:04

回答 1 已采纳首先怀疑过拟合, 减少迭代次数, 像这种非常简单的数据拟合, 完全不需要200这么大的周期, 一般30-50个足够
浅易理解：卷积神经网络（CNN）
2024-03-12 16:23

山山而川_R的博客在人工智能领域中，人工神经元是对生物神经元进行模拟的概念模型，它是构建人工神经网络的基本单元。人工神经元的设计意图是模仿生物大脑中神经元处理信息的方式，即接收输入信号、对信号进行加权处理并产生输出响应...
CNN训练时，为什么每次训练的loss没有持续下降的趋势 cnn pytorch 神经网络
2022-02-07 14:29

回答 2 已采纳你是指每个epoch对不同的数据集还是对同一个数据集训练loss没有下降，这是两回事每个epoch对不同数据集的话，那我无话可说，你开心就好对同一个数据集loss没有下降，那是应为你这才几个epoch
深度学习21天——卷积神经网络（CNN）：天气识别（第5天）
2022-08-04 18:10

清园暖歌的博客当训练完成后更新权重，再使用第101-200的个数据训练，直至第十次使用完训练集中的1000个数据后停止。③设置seed()的时，可以调用多次random()向该随机数的列表中添加信息；而再次使用设置的seed()值时，仅一次有效...
卷积神经网络（CNN）详解
2021-08-05 11:08

红色石头Will的博客章节Filter池化Demo冷知识参考CNN 一共分为输入，卷积，池化，拉直，softmax，输出卷积由互关运算（用Filter完成）和激活函数FilterCNN常用于图像识别，在深度学习...
没有解决我的问题, 去提问

悬赏问题

¥15 树莓派与pix飞控通信
¥15 自动转发微信群信息到另外一个微信群
¥15 outlook无法配置成功
¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题

cnn只加载了神经神经网络，还没开始训练，12G显存就占了12G，怎么回事？

2条回答 默认 最新

悬赏问题

2条回答默认最新