神经网络GPU运算内存不足

类型一（通过自动求导来优化模型参数）

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import optimizers, datasets
from tensorflow.keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
import os

提取mnist数据集
def mnist_dataset():
    (x, y), (x_test, y_test) = datasets.mnist.load_data()   
    x_train,x_valid,y_train,y_valid = train_test_split(x, y, test_size=0.2)   #划分验证集
    #Normalize归一化
    x_train = tf.cast(x_train/255.0, dtype=tf.float32)
    x_valid = tf.cast(x_valid/255.0, dtype=tf.float32)
    x_test = tf.cast(x_test/255.0, dtype=tf.float32)
    #增加维度:( , , )-->( , , , )
    x_train = tf.expand_dims(x_train, axis=3)
    x_valid = tf.expand_dims(x_valid, axis=3)
    x_test = tf.expand_dims(x_test, axis=3)
    #对标签数据进行独热编码
    y_train = tf.one_hot(y_train, depth=10, dtype=tf.float32)
    y_valid = tf.one_hot(y_valid, depth=10, dtype=tf.float32)
    y_test = tf.one_hot(y_test, depth=10, dtype=tf.float32)
    return (x_train, y_train), (x_valid, y_valid), (x_test, y_test)

#定义模型
class Convolution_NN(keras.Model):
    def __init__(self):
        super(Convolution_NN, self).__init__()  # super(): https://wiki.jikexueyuan.com/project/explore-python/Class/super.html
        self.L1_conv = Conv2D(filters=10, kernel_size=(5, 5), activation='relu', padding='same')
        self.L2_conv = Conv2D(filters=10, kernel_size=(5, 5), activation='relu', padding='same')
        self.pool = MaxPooling2D(pool_size=(2, 2), strides=2)
        self.flat = Flatten()
        self.dense1 = Dense(100, activation='tanh')
        self.dense2 = Dense(10, activation='softmax')
    def call(self, inputs):
        h1 = self.L1_conv(inputs)
        h1_pool = self.pool(h1)
        h2 = self.L2_conv(h1_pool)
        h2_pool = self.pool(h2)
        flat_h = self.flat(h2_pool)
        dense1 = self.dense1(flat_h)
        logits = self.dense2(dense1)
        return logits

#定义交叉熵损失函数
def compute_loss(logits, labels):
    return tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels, logits))

#定义预测准确率函数
def compute_accuracy(logits, labels):
    predictions = tf.argmax(logits, axis=1)
    labels = tf.argmax(labels, axis=1)
    return tf.reduce_mean(tf.cast(tf.equal(predictions, labels), tf.float32))

#参数优化
def train_one_step(model, optimizer, x, y):
    with tf.GradientTape() as tape:
        logits = model(x)
        loss = compute_loss(logits, y)
    #compute gradient
    grads = tape.gradient(loss, model.trainable_variables)
    #update to weights
    optimizer.apply_gradients(zip(grads, model.trainable_variables))
#------------------------------
if __name__ == '__main__':
    (x_train, y_train), (x_valid, y_valid), (x_test, y_test) = mnist_dataset()

    #设置训练超参数
    training_epochs = 20 #训练轮数
    batch_size = 50 #单次训练的样本数(批次的大小)  Mini-Batch优化
    learning_rate = 0.001 #学习率

    model = Convolution_NN()
    optimizer = optimizers.Adam(learning_rate=learning_rate)

    steps = int(x_train.shape[0]/batch_size)  #一轮训练的批次

    for epoch in range(training_epochs):
        for step in range(steps):
            X = x_train[step*batch_size:(step+1)*batch_size]
            Y = y_train[step*batch_size:(step+1)*batch_size]
            train_one_step(model, optimizer, X, Y)

类型二（通过tf的高阶API-Keras来训练模型参数）

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import optimizers, datasets
from tensorflow.keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
import os

#提取mnist数据集
def mnist_dataset():
    (x_train, y_train), (x_test, y_test) = datasets.mnist.load_data()   
    #Normalize归一化
    x_train = tf.cast(x_train/255.0, dtype=tf.float32)
    x_test = tf.cast(x_test/255.0, dtype=tf.float32)
    #增加维度:( , , )-->( , , , )
    x_train = tf.expand_dims(x_train, axis=3)
    x_test = tf.expand_dims(x_test, axis=3)
    #对标签数据进行独热编码
    y_train = tf.one_hot(y_train, depth=10, dtype=tf.float32)
    y_test = tf.one_hot(y_test, depth=10, dtype=tf.float32)
    return (x_train, y_train), (x_test, y_test)

#定义模型
class Convolution_NN(keras.Model):
    def __init__(self):
        super(Convolution_NN, self).__init__()  # super(): https://wiki.jikexueyuan.com/project/explore-python/Class/super.html
        self.L1_conv = Conv2D(filters=10, kernel_size=(5, 5), activation='relu', padding='same')
        self.L2_conv = Conv2D(filters=10, kernel_size=(5, 5), activation='relu', padding='same')
        self.pool = MaxPooling2D(pool_size=(2, 2), strides=2)
        self.flat = Flatten()
        self.dense1 = Dense(100, activation='tanh')
        self.dense2 = Dense(10, activation='softmax')
    def call(self, inputs):
        h1 = self.L1_conv(inputs)
        h1_pool = self.pool(h1)
        h2 = self.L2_conv(h1_pool)
        h2_pool = self.pool(h2)
        flat_h = self.flat(h2_pool)
        dense1 = self.dense1(flat_h)
        logits = self.dense2(dense1)
        return logits
#------------------------------
if __name__ == '__main__':
    #os.environ["CUDA_VISIBLE_DEVICES"] = "-1" #GPU内存不足(降低batch_size),改用CPU运算

    (x_train, y_train), (x_test, y_test) = mnist_dataset()

    model = Convolution_NN()
    optimizer = optimizers.Adam()
    model.compile(optimizer=optimizer,
              loss='categorical_crossentropy',
              metrics=['accuracy'])
    #设置训练超参数
    training_epochs = 20 #训练轮数
    batch_size = 50 #单次训练的样本数(批次的大小)  Mini-Batch优化
    #训练模型
    train_history = model.fit(x_train, y_train,
                              validation_split=0.2,
                              epochs=training_epochs,
                              batch_size=batch_size,
                              verbose=2)

一句话总结：类型一，我自己优化参数，在GPU上跑，显示：OOM when allocating tensor with shape[48000,28,28,10] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc [Op:Conv2D]，即内存不足。类型二，无脑调用API优化参数，很流畅的在GPU上跑。为什么呢？很迷惑！讲道理Keras优化参数的方法应该和我一致呀，只是它的封装好了，为什么它的可以在GPU上跑，我的就显示内存不足呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-05-15 19:49
关注
batch_size = 50
这个设置小一些
图片做一个downsample

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用mnist数据搭建的神经网络训练时GPU占用率剧烈波动人工智能机器学习神经网络
2023-04-08 12:36

回答 1 已采纳 mnist数据集太小了，所以gpu用不满，这是很正常的
深度学习代码运行时GPU内存不足 python 深度学习计算机视觉
2022-07-19 19:09

回答 1 已采纳减小BatchSize
jupyter 中tf 搭建神经网络 如何确定自己的GPU参与了计算？ python 分类神经网络
2022-03-02 23:40

回答 1 已采纳有个简单的办法，提前打开任务管理器翻到GPU那一栏，在训练或者预测数据的时候观察各项指标特别是复制有没有起伏
Omega-AI基于java打造的深度学习框架帮助你快速搭建神经网络实现模型推理与训练引擎支持自动求导多线程与GPU运算
2024-04-07 14:59

Omega-AI：基于java打造的深度学习框架，帮助你快速搭建神经网络，实现模型推理与训练，引擎支持自动求导，多线程与GPU运算，GPU支持CUDA，CUDNN。Omega-AI：基于java打造的深度学习框架，帮助你快速搭建神经网络，...
pytorch训练时cuda内存不足 pytorch 目标检测神经网络
2023-03-02 15:28

回答 2 已采纳通常遇到OOM(out of memory)问题, 只有两种解决方案, 降低您网络训练时的batchsize, 或者选用更小的网络. 看到您这里用的resnet50, 8Gmemory够用了, 您可以
pytorch不调用gpu运算 pytorch 深度学习
2022-11-11 16:14

回答 2 已采纳给你找了一篇非常好的博客，你可以看看是否有帮助，链接：pytorch无法调用gpu的一些解决方法
训练模型的时候显示GPU可使用内存不够，打开任务管理器查看内存是够用是什么情况？ python 人工智能深度学习
2021-07-22 09:48

回答 4 已采纳我的猜测，你可能有一块集成显卡，但没有禁用
深度神经网络移动终端GPU加速实践
2021-02-25 00:42

作为工程人出身的我们，更是迫切需要主动去迎接AI时代的到来，带着智能图像识别的需求，我们尝试去工程化深度神经网络并最终落地，当中的一些实践经验通过本文记录下来。MobileNet是谷歌为移动终端设备专门设计的...
tensorflow-gpu为何无法调用GPU进行运算？ tensorflow
2018-11-08 07:30

回答 5 已采纳在 https://ask.csdn.net/questions/710166 回答你了，如果满意，请点我回答左上角的箭头和采纳。谢谢
tensorflow-gpu为何无法调用GPU进行运算??? tensorflow
2018-11-08 07:52

回答 3 已采纳 GT730有好几种，一个是GT640的马甲卡，采用Kepler核心，384 CUDA Cores，叫做GK208/GK107，反正有个K，这个支持CUDA 3.0，可以跑TF（但是相当慢）还有一个
tensorflow-gpu运行神经网络时一训练内核就失联 python tensorflow
2023-03-10 22:45

回答 4 已采纳参考GPT和自己的思路：出现内核崩溃的原因可能有很多，以下是一些可能的解决方案： 1 确保你的TensorFlow-GPU版本与CUDA和cuDNN版本兼容。可以参考TensorFlow官方网站提供
训练神经网络gpu占用率低,gpu为什么适合神经网络
2022-08-17 12:30

阳阳2013哈哈的博客谷歌人工智能写作项目：小发猫为什么要用GPU来训练神经网络而不是CPU? 许多现代神经网络的实现基于GPU，GPU最初是为图形应用而开发的专用硬件组件常见的神经网络结构。所以神经网络收益于游戏产业的发展。中央...
GPU中使用统一内存 c语言
2022-05-30 18:19

回答 1 已采纳它还是需要在物理层面进行数据传输的，你在用统一内存的时候，不再需要显示的这数据传输的函数了
基于java打造的深度学习框架，助你快速搭建神经网络，实现模型推理与训练，引擎支持自动求导，多线程与GPU运算GPU支持CUDA
2024-02-04 10:07

Omega-AI：基于java打造的深度学习框架，帮助你快速搭建神经网络，实现模型推理与训练，引擎支持自动求导，多线程与GPU运算，GPU支持CUDA，CUDNN。
基于java打造的深度学习框架，帮助你快速搭建神经网络，实现模型推理与训练，引擎支持自动求导，多线程与GPU运算
2024-04-27 10:11

基于java打造的深度学习框架，帮助你快速搭建神经网络，实现模型推理与训练，引擎支持自动求导，多线程与GPU运算，GPU支持CUDA，CUDNN。
没有解决我的问题, 去提问

悬赏问题

¥15 怎么改成输入一个要删除的数后现实剩余的数再输入一个删除的数再现实剩余的数用yes表示继续no结束程序
¥15 在启动roslaunch时出现如下问题
¥15 汇编语言实现加减法计算器的功能
¥20 关于多单片机模块化的一些问题
¥30 seata使用出现报错，其他服务找不到seata
¥35 引用csv数据文件（4列1800行），通过高斯-赛德尔法拟合曲线，在选取（每五十点取1点）数据，求该数据点的曲率中心。
¥20 程序只发送0X01,串口助手显示不正确,配置看了没有问题115200-8-1-no，如何解决？
¥15 Google speech command 数据集获取
¥15 vue3+element-plus页面崩溃
¥15 像这种代码要怎么跑起来？

神经网络GPU运算内存不足

类型一（通过自动求导来优化模型参数）

类型二（通过tf的高阶API-Keras来训练模型参数）

1条回答 默认 最新

悬赏问题

1条回答默认最新