用tensorflow跑卷积网络报错:InternalError (see above for traceback): cudnn PoolForward launch failed

图片说明
用tf跑一个卷积神经网络时报错!
我查看了很多关于报该类型的错误文档,大多都说是因为tensorflow是一个很贪心的框架,总是试图为自己分配全部的GPU资源,但实际上GPU资源不可能完全一点不被其他程序占用,导致初始化失败。解决的办法都是再创建session时加上配置参数:
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
sess = Session(config=tf.ConfigProto(gpu_options=gpu_options))
还有许多其他的参数,我都试了,但还是报了相同的错误,心里苦,跪求各位dalao!

0
lvtao913
泠零〇 最后搞定了吗?我也是碰到这个问题,都想去装个LINUX了。。。
3 个月之前 回复

2个回答

有没有tf的dalao来看看呀!

0

https://github.com/tensorflow/tensorflow/issues/19567
pip install tf-nightly-gpu. This may help.

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
TensorFlow Cudnn常见cudnn报错解决办法
用Spyder执行TensorFlow代码时,每次都会显示“kernel died,restarting”.查找原因发现终端窗口有如下报错:nnLoadedn runtime CuDNN library: 5005 (compatibility version 5000) but source was compiled with 5103 (compatibility version 510
FastMaskRCNN运行错误排查
其git地址为:https://github.com/CharlesShang/FastMaskRCNN,按照其步骤描述进行环境配置,在最后一步运行的时候,出现Restored 267(640) vars from ./data/pretrained_models/resnet_v1_50.ckptn2017-12-03 20:46:12.688523: W tensorflow/core/fram
使用CuDNN进行卷积运算
CuDNNnnNVIDIA ® cuDNN is a GPU-accelerated library of primitives for deep neural networks. It provides highly tuned implementations of routines arising frequently in DNN applications:nnnConvolution fo...
Tensorflow + Faster RCNN 遇到的问题及解决方案
代码fork自 https://github.com/endernewton/tf-faster-rcnnnn1、数据准备过程,参见pytorch版本,见这里。nn2、遇到问题:InvalidArgumentError (see above for traceback): Assign requires shapes of both tensors to match.nn      解决方案:删除...
Tensorflow 实践中常见的错误解决方法
1、ValueError: setting an array element with a sequence.rnrn这个错误通常是由于train_x,train_y 和 mask(test_x,test_y,mask)出现了问题。这个时候可以尝试打印部分train_x,部分train_y或mask。尤其注意他们的长度信息是否对应。遇到过的出错有: rnX_train, X_test, y_train,...
tensorflow 问题与解决
1.no supported kernel for GPU devices is available.nn# 加上下面一行就可以使用 个gpu了nconfig = tf.ConfigProto(allow_soft_placement=True)n# 这一行设置 gpu 随使用增长,我一般都会加上nconfig.gpu_options.allow_growth = True
跟着TensorFlow的进阶级教程实现MNIST库的训练
背景介绍n代码实现及结果n小问题 nResourceExhaustedError的原因及解决方式nSaver()进行模型存储及恢复n再说一下DL的运行时间吧n优质资源分享n背景介绍做这件事的初衷有二: n①做完入门级的,自然要进阶一下。 n②之前做到的准确率只有92%,据说进阶版可以把准确率做到99.2% n步骤还是参考TensorFlow的中文教程,自然没有上次那么简单,有些坑掉进去了,好歹最后爬
tensorflow测试模型时NotFoundError错误解决方法
错误代码如下:NotFoundError (see above for traceback): Unsuccessful TensorSliceReader constructor: Failed to find any matching files for xxxn……经查资料分析,错误原因可能出在加载模型时的路径问题。我采用的加载模型方法:with tf.Session() as sess:
TensorFlow实战学习笔记2
我直接跳过了第四章来到卷积神经网络这里,书中给出了一个简单的两层神经网络。rn用的笔记本训练的,显卡GTX960m,内存四个grn但运行书中代码后会出现rnResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[10000,32,28,28]rn[[Node: Conv2D =
TensorFlow && py3.5 运行遇到的问题笔记
1.IndentationError:n unindent does not match any outer indentation leveln错误原因:脚本中tab和空格混用,由于py对格式有严格的要求,故最好不要在行首用空格代替tab去进行对其n2.ImportError: No module named input_datan错误原因:第一次安装TensorFlow的时候经常会出现
TensorFlow 中遇到的坑
最近在做GANS的实验,用到了TensorFlow,把坑总结一下。n1 ResourceExhaustedErrorn 具体是这样的:现在主机上有四块卡,有一块有任务。 n 这也是TensorFlow很坑爹的一块:训练程序默认吃掉所有的显存。用掉所有的卡。。。n解决办法n #CUDA_VISIBLE_DEVICES=1 python my_script.py n 设置这个训练程序只可以看到一
tensorflow 连续restore时碰见的bug以及解决方法
1. bug最近在使用tensorflow做图像超分时,碰见以下bug。每次恢复一张图片时,程序运行正常。但当恢复多张图片时,就会报以下错误:NotFoundError (see above for traceback): Key Conv_100/biases not found in checkpointn [[Node: save_1/RestoreV2_6 = RestoreV2[d
tensorflow 中遇到的问题总结
tensorflow 中遇到的问题总结nn nn1.TFRecordReader "OutOfRangeError (see above for traceback): RandomShuffleQueue '_1_shuffle_batch/random_shuffle_queue' is closed and has insufficient elements (requested 1, cu...
tensorflow由于未初始化变量所导致的错误
初始代码import pandas as pdnimport numpy as npnimport tensorflow as tftrain_input_data = pd.read_excel('new_data/4.12.2.xlsx',header=None,sheetname='train')ntrain_input_data = np.array(train_input_data).ra
tensorflow 队列管理之异步操作
n# -*- coding: utf-8 -*-n"""nCreated on Thu Oct 25 09:49:34 2018nn@author: Greyn"""nimport tensorflow as tfn#模拟异步子线程存入样本,主线程读取样本n#1.定义一个队列,100nQ = tf.FIFOQueue(100,tf.float32)nn#2.定义子线程做的操作,循环+1 放入队列n...
tensorflow-gpu遇到的问题
遇到的第一个问题:InvalidArgumentError
tensorflow在载入模型的时候会出现Key Variable_4 not found in checkpoint的解决思路
1、首先是自己定义的参数变量是否和保存的参数变量的类型是一致的2、在文件下面是否有一个叫做chockpoint的东西存在3、最后如果运行多次出现NotFoundError (see above for traceback): Key Variable_4 not found in checkpoint [[Node: save_2/RestoreV2 = RestoreV2[dtypes=[DT...
关于机器上已安装CUDA,但在anaconda下tensorflow出现cudaGetDevice() failed问题的解决
机器已经安装了CUDA 9.1,驱动为390.58,我补装了对应的cudnn,并且测试通过,但是在anaconda环境下,用conda install tensorflow-gpu=1.12后,运行sess = tf.Session()时报错:ntensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed...
TensorFlow下使用SSD在windows中遇到的问题
Windows下TensorFlow+SSD遇到的问题rn问题一:训练速度很慢,没有使用GPUrn解决:rn安装匹配的GPU版本的TensorFlow。rn参考:rntensorflow-gpu安装时,出现的各种错误rn问题二:InvalidArgumentError (see above for traceback): Default MaxPoolingOp only supports NHWC on d...
tensorflow 1.8 无法调用GPU的问题
代码:https://github.com/dennybritz/cnn-text-classification-tfnn1) spyder情况下运行课程以上链接中的train.py,错误提示:InternalError (see above for traceback): CUB reduce errorinvalid device function。我之前用CPU版本的 tf 是可以运行的,跑...
TensorFlow中的一个重要op---MatMul的实现(一)
本文目的是以Tensorfl中的MatMul这个具有代表性又比较简单的ops为例介绍一下TensorFlow中的图的节点是怎么实现的。我个人认为TensorFlow中的ops是整个TensorFlow的核心,如果理解了这个,那么对TensorFlow就有了比较深的认识。nn在阅读这段代码前看一下官方文档中的添加新的op会很有帮助:n中文翻译:http://www.tensorfly.cn/t
tensorflow 模型与数据的存储与恢复
我们在tensorflow中训练模型时,往往一个模型需要训练好几天,训练中可能出现意外关机而停止训练。如果此时再重头开始,必然使得前面已经训练的结果功亏一篑。于是,就有了save与restore。变量在文件中以name为名称存储import tensorflow as tfn# 定义存储路径nsave_path = "./test/model.ckpt"nn# 存储变量nv1 = tf.get_v...
TensorFlow网络模型的保存与导入(save and restore)
TensorFlow网络模型的保存与导入(save and restore)nn构建深度学习网络,训练时间往往比较长,当训练完成以后,效果比较好,我们希望能将模型保存下来,进行实际的部署和测试,或者进行迁移学习。nn下面结合我自己的一些实践介绍一下TensorFlow模型保存和导入的方法。 n主要有两种: n(1)传统的使用ckpt模型,然后需要把网络模型整体框架重写一次; n(2)较高版本的tf...
6.1 Tensorflow笔记(基础篇):队列与线程
前言在Tensorflow的实际应用中,队列与线程是必不可少,主要应用于数据的加载等,不同的情况下使用不同的队列,主线程与其他线程异步进行数据的训练与读取,所以队列与线程的知识也是Tensorflow必须要学会的重要知识 n另一方面,Tensorflow作为符号编程框架,在构图后,加载数据有三种方式,预加载与填充数据都存在,数据量大消耗内存等情况的出现.使用第三种方式文件读取避免了前两者的缺点,但是
tensorflow安装时遇到的问题
tensorflow安装成功,import tensorflow时出错。nImportError: DLL load failed: 内存位置访问无效。nnDuring handling of the above exception, another exception occurred:nnnTraceback (most recent call last):nnnFile "
Tensorflow 2. 训练过程,服务器显示Resource exhausted?
  我遇到的问题:Resource exhausted: OOM when allocating tensor with shape[256, 50000] Traceback (most recent call last): …  问题原因:我在seq2seq模型和attention机制的基础上,加入一个新的encoder、并且调整了attention计算公式。问题在于引入了新的变量和参数,因此...
tensorflow 中的embedding 报错问题解决
今天TensorFlow中的tf.contrib.layers.embed_sequence来对输入进行embedding时候,发现报了如下的错误:n    InvalidArgumentError (see above for traceback): indices[1,2] = 6 is not in [0, 6)n [[Node: EmbedSequence_8/embedding_lo
Tensorflow 错误信息记录
>>> import tensorflow as tfnTraceback (most recent call last):n File "<stdin>", line 1, in <module>n File "/usr/local/lib/python2.7/dist-packages/tensorflow/__init__.py", line 2...
【TensorFlow-windows】学习笔记二——低级API
前言nn上一篇博客初步了解了tensorflow中建立机器学习模型的方法:可以使用eager execution和graph execution两种模式,可以使用高级API estimator中已经封装好的模型,也可以自己创建estimator,更重要的是我们也可以使用低级API自行设计模型。这里重点研究研究如何使用低级APInn主要内容包含:nnn张量、变量n构建计算图及其运行n可视化nnn国际...
深度学习项目问题汇总(20180110更新)
1. tfrecords数据转换问题1.1 ipython或python console使用问题在ipython或python console中使用import 某个脚本模块,脚本修改后,通过reload重新加载,如再次import会有问题,否则只能重启终端。 npython3的reload在importlib中import importlibnimportlib.reload("model nam
TensorFlow 使用 tf.summary.FileWriter 添加对标量的统计与观察时报错
报错信息:nnInvalidArgumentError (see above for traceback): tags and values not the same shape: [] != [1,1] (tag 'y')n         [[node y (defined at <stdin>:1)  = ScalarSummary[T=DT_FLOAT, _device="/j...
tensorflow读取数据到队列当中
TensorFlow是一种符号编程框架(与theano类似),先构建数据流图再输入数据进行模型训练。Tensorflow支持很多种样例输入的方式。最容易的是使用placeholder,但这需要手动传递numpy.array类型的数据。第二种方法就是使用二进制文件和输入队列的组合形式。这种方式不仅节省了代码量,避免了进行datan augmentation和读文件操作,可以处理不同类型的数据, 而
TensorFlow 基础知识笔记之队列和线程
TensorFlow 基础知识笔记之队列和线程和 TensorFlow 中的其他组件一样, 队列(queue)本身也是图中的一个节点,是一种有状态的节点,其他节点,如入队节点(enqueue)和出队节点(dequeue),可以修改它的内容。例如,入队节点可以把新元素插到队列末尾,出队节点可以把队列 n前面的元素删除。环境:win7 64位 tensorflow1.3-gpu python3.5
TensorFlow读取图片机制(1)--直接读取图片
读取机制有四种方法方法一直接读取图片直接写代码# tensorflow read picture读取图片机制import tensorflow as tfwith tf.Session()  as sess :    filename = [ 'C0.jpg', 'C1.jpg' ,'C2.jpg']    filename_queue =tf.train.string_input_produce...
tenforflow版YOLOv3下VOC数据集的准备和训练
YOLOv3在这个网址下载,并且按照他的指示先配置好环境:nnhttps://github.com/YunYang1994/tensorflow-yolov3nn或者你可以参考我的这篇更详细的博客来配置环境还有安装YOLOv3,那里面的COCO数据集就不用准备了,COCO的训练部分也不要走,因为我们要训练的是VOC数据:nnhttps://blog.csdn.net/qq_25799253/art...
Win10 下安装 TensorFlow 遇到的一些问题
偶然得到了一个英伟达的显卡,高兴的不得了,高兴之余第一反应就是赶紧配置好,试试效果。结果遇到了一些问题,这里分享出来,希望能帮助遇到同样问题的小伙伴们。我的系统是win10 64位,显卡是GTX 1050Ti,安装TensorFlow参考的博客是http://blog.csdn.net/u010099080/article/details/53418159,博主给了一些安装的建议和遇到错误的解决办法
tensorflow遇到的问题
raise ImportError(str(msg) + ‘, please install the python3-tk package’)rnImportError: No module named ‘_tkinter’, please install the python3-tk packagern解决方法:是由于python的版本没有包含tkinter的模块,只需要把tk的package安装就...
深度学习训练时相关问题
1.Nan错误InvalidArgumentError (see above for traceback): Nan in summary histogram for: fc6/weights_0n [[Node: fc6/weights_0 = HistogramSummary[T=DT_FLOAT, _device="/job:localhost/replica:0/task:0/devic...
Tensorflow读取并使用预训练模型:以inception_v3为例
在使用Tensorflow做读取并finetune的时候,发现在读取官方给的inception_v3预训练模型总是出现各种错误,现记录其正确的读取方式和各种错误做法: n关键代码如下:nnnnimport tensorflow as tfnimport tensorflow.contrib.slim as slimnfrom tensorflow.contrib.slim.python.slim....
ResourceExhaustedError的原因及解决方式
在对see in the dark 代码进行测试时,我输入了一张[2848,4256,3]的ARW  sony原始数据图片,运行后出现下面错误:tensorflow.python.framework.errors_impl.ResourceExhaustedError: OOM when allocating tensor with shape[1,1424,2128,64]表示卷积后生成的图片数...
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 深度学习tensorflow课程 java跑深度学习