tensorflow-gpu Failed to get convolution algorithm.

成功安装了gpu版的tensorflow之后,尝试跑两个神经网
第一个:全连接的DNN
关键代码如下:

xs=tf.placeholder(tf.float32,[None,10])
ys=tf.placeholder(tf.float32,[None,7])


'layer1:ful connect'
W_fc1=weight_variable([10,5000],name_data=None) 
b_fc1=bias_variable([5000],name_data=None)

h_fc1=tf.nn.relu(tf.matmul(xs,W_fc1)+b_fc1)

'layer2:ful connect'
W_fc2=weight_variable([5000,5000],name_data=None) 
b_fc2=bias_variable([5000],name_data=None)

h_fc2=tf.nn.relu(tf.matmul(h_fc1,W_fc2)+b_fc2)

'layer3:ful connect'
W_fc3=weight_variable([5000,5000],name_data=None) 
b_fc3=bias_variable([5000],name_data=None)

h_fc3=tf.nn.relu(tf.matmul(h_fc2,W_fc3)+b_fc3)

'output layer::ful connect,maxsoft'
W_fc4=weight_variable([5000,7],name_data=None) 
b_fc4=bias_variable([7],name_data=None)


output=tf.nn.sigmoid(tf.matmul(h_fc3,W_fc4)+b_fc4)

能够顺利的利用gpu加速,确实比cpu的计算速度快不少。
然而,在跑cnn的时候(部分代码如下)

'def weights'
def weight_variable(shape,name_data): 
    initial=tf.truncated_normal(shape,stddev=0.1)
    return tf.Variable(initial,dtype=tf.float32,name=name_data)

'def biases'
def bias_variable(shape,name_data): 
    initial=tf.constant(0.1,shape=shape) 
    return tf.Variable(initial,dtype=tf.float32,name=name_data)

'def conv2d layer'
def conv2d(x,W):
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')

'def pooling layer as max_pool'
def max_pool_2x2_v(x): 
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='VALID')

'def pooling layer as max_pool'
def max_pool_2x2_s(x): 
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,1,1,1],padding='SAME')


#input layer
'placeholder xs & ys'
xs=tf.placeholder(tf.float32,[None,64])
ys=tf.placeholder(tf.float32,[None,1])
'reshape the xs as x_image,which shape is 10*10'
x_image=tf.reshape(xs,[-1,8,8,1])
print('red input::',x_image)


#layer2:conv layer 2 patches
'patch1'
W_conv_r_1_1=weight_variable([3,3,1,20],name_data='W_conv_r_1_1')
b_conv_r_1_1=bias_variable([20],name_data='b_conv_r_1_1')
h_conv_r_1_1=tf.nn.relu6(conv2d(x_image,W_conv_r_1_1)+b_conv_r_1_1)
'patch2'
W_conv_r_1_2=weight_variable([3,3,1,10],name_data='W_conv_r_1_2')
b_conv_r_1_2=bias_variable([10],name_data='b_conv_r_1_2')
h_conv_r_1_2=tf.nn.relu6(conv2d(x_image,W_conv_r_1_2)+b_conv_r_1_2)
'concat to layer2'
h_conv_r_1=tf.concat([h_conv_r_1_1,h_conv_r_1_2],3)
print("red layer2::",h_conv_r_1)

#layer3:conv layer:1 patch add with h_conv_r_1_2
'patch1'
W_conv_r_2_1=weight_variable([5,5,30,30],name_data='W_conv_r_2_1')
b_conv_r_2_1=bias_variable([30],name_data='b_conv_r_2_1')
h_conv_r_2_1=tf.nn.elu(conv2d(h_conv_r_1,W_conv_r_2_1)+b_conv_r_2_1)
'patch for next layer'
W_conv_r_2_2=weight_variable([5,5,30,15],name_data='W_conv_r_2_2')
b_conv_r_2_2=bias_variable([15],name_data='b_conv_r_2_2')
h_conv_r_2_2=tf.nn.elu(conv2d(h_conv_r_1,W_conv_r_2_2)+b_conv_r_2_2)
'concat for layer3'
h_conv_r_2=tf.concat([h_conv_r_2_1,h_conv_r_1_2],3)
print('red layer3;:',h_conv_r_2) 

上述代码是一个利用cnn训练黑白棋的程序,可以在CPU环境下顺利的运行,但是在gpu环境下,运行时会报错:Failed to get convolution algorithm (无法获得卷积算法)
完整的报错信息如下:

Traceback (most recent call last):
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1334, in _do_call
    return fn(*args)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1319, in _run_fn
    options, feed_dict, fetch_list, target_list, run_metadata)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1407, in _call_tf_sessionrun
    run_metadata)
tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
     [[{{node Conv2D}} = Conv2D[T=DT_FLOAT, data_format="NHWC", dilations=[1, 1, 1, 1], padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](Reshape, W_conv_r_1_1/read)]]
     [[{{node Sigmoid/_75}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_105_Sigmoid", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "C:\Users\fengg\Desktop\Othello with ResNet  3\Othello with ResNet-large\Othello with ResNet-large\train_ResNet.py", line 326, in <module>
    try_point=sess.run(prediction_r, feed_dict={xs:board_try,ys:[[0.0001]]})
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 929, in run
    run_metadata_ptr)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1152, in _run
    feed_dict_tensor, options, run_metadata)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1328, in _do_run
    run_metadata)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1348, in _do_call
    raise type(e)(node_def, op, message)
tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
     [[node Conv2D (defined at C:\Users\fengg\Desktop\Othello with ResNet  3\Othello with ResNet-large\Othello with ResNet-large\train_ResNet.py:31)  = Conv2D[T=DT_FLOAT, data_format="NHWC", dilations=[1, 1, 1, 1], padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](Reshape, W_conv_r_1_1/read)]]
     [[{{node Sigmoid/_75}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_105_Sigmoid", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

Caused by op 'Conv2D', defined at:
  File "<string>", line 1, in <module>
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\idlelib\run.py", line 130, in main
    ret = method(*args, **kwargs)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\idlelib\run.py", line 357, in runcode
    exec(code, self.locals)
  File "C:\Users\fengg\Desktop\Othello with ResNet  3\Othello with ResNet-large\Othello with ResNet-large\train_ResNet.py", line 57, in <module>
    h_conv_r_1_1=tf.nn.relu6(conv2d(x_image,W_conv_r_1_1)+b_conv_r_1_1)
  File "C:\Users\fengg\Desktop\Othello with ResNet  3\Othello with ResNet-large\Othello with ResNet-large\train_ResNet.py", line 31, in conv2d
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\ops\gen_nn_ops.py", line 1044, in conv2d
    data_format=data_format, dilations=dilations, name=name)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\framework\op_def_library.py", line 787, in _apply_op_helper
    op_def=op_def)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\util\deprecation.py", line 488, in new_func
    return func(*args, **kwargs)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\framework\ops.py", line 3274, in create_op
    op_def=op_def)
  File "C:\Users\fengg\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\framework\ops.py", line 1770, in __init__
    self._traceback = tf_stack.extract_stack()

UnknownError (see above for traceback): Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
     [[node Conv2D (defined at C:\Users\fengg\Desktop\Othello with ResNet  3\Othello with ResNet-large\Othello with ResNet-large\train_ResNet.py:31)  = Conv2D[T=DT_FLOAT, data_format="NHWC", dilations=[1, 1, 1, 1], padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](Reshape, W_conv_r_1_1/read)]]
     [[{{node Sigmoid/_75}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_105_Sigmoid", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]] 

请问这个问题该如何解决,谢谢了!

weixin_38946936
weixin_38946936 回复caozhy: 是不是我装的版本还是不对啊,我看cuDNN有好几个版本都对应cuda9.0
大约一年之前 回复
weixin_38946936
weixin_38946936 解压后,那个train_ResNet.py就是训练主程序,运行时会先询问红蓝双方的学习率,然后敲两个回车,它应该就会训练10次。您试试,受累了
大约一年之前 回复
weixin_38946936
weixin_38946936 解压后,那个train_ResNet.py
大约一年之前 回复
weixin_38946936
weixin_38946936 https://pan.baidu.com/s/1Q_56kdpESGuU39i0RLGMWg密码:zw7g
大约一年之前 回复
caozhy
贵阳老马马善福专业维修游泳池堵漏防水工程 代码和数据集放在网盘(如果数据集可以公开下载,请给地址),如果数据集很大,给一个样本。我在我这里跑下看看,排除下硬件、环境等原因
大约一年之前 回复

1个回答

我不知道这样算不算运行了,没有报错

我的软硬件:
Windows 10 1803 x64 10.0.17134.407
CUDA Version 9.2.148
CUDNN 7.1.4
Tensorflow 1.9.0
Python 3.6.4 (v3.6.4:d48eceb, Dec 19 2017, 06:54:40)
CPU Intel Core 2 Duo E4600 2.4GHz
GPU NVIDIA Geforce GTX650 2GB GDDR5
RAM 2.7GB

你把 windows cuda cudnn tf python 这几样尽量按照我的版本来

11.17.2018 2150更新

cuda下载方式
https://developer.nvidia.com/cuda-92-download-archive
选择windows 10
cuDNN下载方式
你登录 https://developer.nvidia.com/cudnn
然后注册一个用户,然后登录后点那个下载,勾选agree
选择Archived cuDNN Releases
然后看下图
图片说明
要根据你的cuda版本和windows版本(windows必须是64bit的)来选择
我这里因为是windows 10和cuda 9.2,所以选择cuDNN v7.1.4 Library for Windows 10

最后附上两个文件的文件名和大小,你下载完核对下,如果字节数能一致,就没问题了。
文件名 cuda_9.2.148_win10.exe 大小 1.47 GB (1,583,355,224 bytes)
文件名 cudnn-9.2-windows10-x64-v7.1.zip 大小206 MB (216,853,802 bytes)
文件比较大,我暂时就不传了,如果实在不行,再说。

csdn_pfyang
csdn_pfyang 回复追赶科比: 你好,我也遇到了这个问题。你解决了吗
7 个月之前 回复
weixin_42967286
追赶科比 回复lele040: 我想问下您的问题解决了吗 我的还是解决不了
11 个月之前 回复
weixin_42967286
追赶科比 博主 我遇到的问题跟你的是一样的 请问您怎么解决的呢
12 个月之前 回复
lele040
lele040 我也遇到了这个问题,请问博主是怎么解决的
12 个月之前 回复
caozhy
贵阳老马马善福专业维修游泳池堵漏防水工程 我更新了答案,你看下
大约一年之前 回复
weixin_38946936
weixin_38946936 您的CUDA cuDNN tf 有没有安装包可以网盘发我一下?我这怕再下错了,谢谢了!
大约一年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
构建cycleGAN严重问题
-
卷积神经网络中,用Im2col实现卷积层,但是在调用convolution类时报错
-
YOLO在本机运行时候报错
-
在caffe下训练修改后的SSD网络时报错
-
如何对使用ssd检测出来的目标进行计数
-
facenet中mtcnn的代码部分,有一些疑惑
-
Tensorflow实现简单CNN模型中某一层shape的计算问题
-
caffe生成解决方案时出错
-
如何在keras+tensorflow中对4通道图像如何输入并分类呢?
-
keras实现人脸识别,训练失败……请教大神指点迷津!!!
-
faster rcnn训练的时候应该是哪个层出了问题
-
深度学习图像分区:Deeplab v2 pretrained model 跑不出像样的结果
-
使用keras搭建黑体汉字单个字符识别网络val_acc=0.0002
-
程序运行到一半自动停止却不报错
-
Python中装饰器@wraps
-
基于Keras的YOLOV3源码实现疑问
-
模型分别在mac和windows服务器上跑,准确率相差60%多!
-
关于分数阶傅里叶变换
-
python keras sequential输入
-
学会了这些技术,你离BAT大厂不远了
每一个程序员都有一个梦想,梦想着能够进入阿里、腾讯、字节跳动、百度等一线互联网公司,由于身边的环境等原因,不知道 BAT 等一线互联网公司使用哪些技术?或者该如何去学习这些技术?或者我该去哪些获取这些技术资料?没关系,平头哥一站式服务,上面统统不是问题。平头哥整理了 BAT 等一线大厂的必备技能,并且帮你准备了对应的资料。对于整理出来的技术,如果你掌握的不牢固,那就赶快巩固,如果你还没有涉及,现在...
程序员真是太太太太太有趣了!!!
网络上虽然已经有了很多关于程序员的话题,但大部分人对这个群体还是很陌生。我们在谈论程序员的时候,究竟该聊些什么呢?各位程序员大佬们,请让我听到你们的声音!不管你是前端开发...
史上最详细的IDEA优雅整合Maven+SSM框架(详细思路+附带源码)
网上很多整合SSM博客文章并不能让初探ssm的同学思路完全的清晰,可以试着关掉整合教程,摇两下头骨,哈一大口气,就在万事具备的时候,开整,这个时候你可能思路全无 ~中招了咩~ ,还有一些同学依旧在使用eclipse或者Myeclipse开发,我想对这些朋友说IDEA 的编译速度很快,人生苦短,来不及解释了,直接上手idea吧。这篇文章每一步搭建过程都测试过了,应该不会有什么差错。本文章还有个比较优秀的特点,就是idea的使用,基本上关于idea的操作都算是比较详细的,所以不用太担心不会撸idea!最后,本文
我花了一夜用数据结构给女朋友写个H5走迷宫游戏
起因 又到深夜了,我按照以往在csdn和公众号写着数据结构!这占用了我大量的时间!我的超越妹妹严重缺乏陪伴而 怨气满满! 而女朋友时常埋怨,认为数据结构这么抽象难懂的东西没啥作用,常会问道:天天写这玩意,有啥作用。而我答道:能干事情多了,比如写个迷宫小游戏啥的! 当我码完字准备睡觉时:写不好别睡觉! 分析 如果用数据结构与算法造出东西来呢? ...
接班马云的为何是张勇?
上海人、职业经理人、CFO 背景,集齐马云三大不喜欢的张勇怎么就成了阿里接班人? 作者|王琳 本文经授权转载自燃财经(ID:rancaijing) 9月10日,张勇转正了,他由阿里巴巴董事局候任主席正式成为阿里巴巴董事局主席,这也意味着阿里巴巴将正式开启“逍遥子时代”。 从2015年接任CEO开始,张勇已经将阿里巴巴股价拉升了超过200%。但和马云强大的个人光环比,张勇显得尤其...
让程序员崩溃的瞬间(非程序员勿入)
今天给大家带来点快乐,程序员才能看懂。 来源:https://zhuanlan.zhihu.com/p/47066521 1. 公司实习生找 Bug 2.在调试时,将断点设置在错误的位置 3.当我有一个很棒的调试想法时 4.偶然间看到自己多年前写的代码 5.当我第一次启动我的单元测试时 ...
接私活必备的 10 个开源项目!
点击蓝色“GitHubDaily”关注我加个“星标”,每天下午 18:35,带你逛 GitHub!作者 | SevDot来源 | http://1t.click/VE8W...
Spring高级技术梳理
Spring高级技术梳理 序言正文SpringDate部分Spring全家桶之SpringData——预科阶段Spring全家桶之SpringData——Spring 整合Hibernate与Hibernate JpaSpring全家桶之SpringData——Spring Data JPASpring全家桶之SpringData——SpringData RedisSpringBoot部分Sp...
如何在Windows中开启"上帝模式"
原文链接 : https://mp.weixin.qq.com/s?__biz=MzIwMjE1MjMyMw==&amp;mid=2650202982&amp;idx=1&amp;sn=2c6c609ce06db1cee81abf2ba797be1b&amp;chksm=8ee1438ab996ca9c2d0cd0f76426e92faa835beef20ae21b537c0867ec2773be...
飞天智能:阿里云的 AI 落地野心
当下,AI 业界不会否认的一个事实是,AI实力的比拼不再是单点的算法技术能力,而是从底层算法到应用平台的全面AI能力。单纯的算法,只是实验室里的乐趣,唯有结合商业的数据处...
为什么平头哥做芯片如此迅猛?
作者 | 胡巍巍 发自杭州云栖大会 责编 | 唐小引 出品 | CSDN(ID:CSDNnews) 2018年10月31日,阿里旗下的平头哥半导体有限公司成立。 如今,平头哥成立不到一年,就已成绩斐然。 2019年9月25日,阿里巴巴旗下半导体公司平头哥,发布含光800芯片。 2019年7月25日,平头哥发布成立后第一个基于RISC-V的处理器IP Core玄铁910。...
分享靠写代码赚钱的一些门路
作者 mezod,译者 josephchang10如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。今天给大家分享一个精彩...
技术人员要拿百万年薪,必须要经历这9个段位
很多人都问,技术人员如何成长,每个阶段又是怎样的,如何才能走出当前的迷茫,实现自我的突破。所以我结合我自己10多年的从业经验,总结了技术人员成长的9个段位,希望对大家的职...
多线程编程是后台开发人员的基本功
这里先给大家分享一个小故事:在我刚开始参加工作的那年,公司安排我开发一款即时通讯软件(IM,类似于 QQ 聊天软件),在这之前我心里也知道如果多线程操作一个整型值是要加锁...
分布式、多线程、高并发都不懂,拿什么去跳槽
当提起这三个词的时候,是不是很多人都认为分布式=高并发=多线程?当面试官问到高并发系统可以采用哪些手段来解决,或者被问到分布式系统如何解决一致性的问题,是不是一脸懵逼?确...
动画:用动画给面试官解释 TCP 三次握手过程
作者 | 小鹿 来源 | 公众号:小鹿动画学编程 写在前边 TCP 三次握手过程对于面试是必考的一个,所以不但要掌握 TCP 整个握手的过程,其中有些小细节也更受到面试官的青睐。 对于这部分掌握以及 TCP 的四次挥手,小鹿将会以动画的形式呈现给每个人,这样将复杂的知识简单化,理解起来也容易了很多,尤其对于一个初学者来说。 学习导图 一、TCP 是什么? TCP(Transmissio...
为什么程序员在学习编程的时候什么都记不住?
在程序员的职业生涯中,记住所有你接触过的代码是一件不可能的事情!那么我们该如何解决这一问题?作者 |Dylan Mestyanek译者 | 弯月,责编 | 屠敏出品 |...
500行代码,教你用python写个微信飞机大战
这几天在重温微信小游戏的飞机大战,玩着玩着就在思考人生了,这飞机大战怎么就可以做的那么好,操作简单,简单上手。 帮助蹲厕族、YP族、饭圈女孩在无聊之余可以有一样东西让他们振作起来!让他们的左手 / 右手有节奏有韵律的朝着同一个方向来回移动起来! 这是史诗级的发明,是浓墨重彩的一笔,是…… 在一阵抽搐后,我结束了游戏,瞬时觉得一切都索然无味,正在我进入贤者模式时,突然想到,如果我可以让更多人已不同的方式体会到这种美轮美奂的感觉岂不美哉? 所以我打开电脑,创建了一个 `plan_game.py`……
2019诺贝尔经济学奖得主:贫穷的本质是什么?
2019年诺贝尔经济学奖,颁给了来自麻省理工学院的 阿巴希·巴纳吉(Abhijit Vinayak Banerjee)、艾丝特·杜芙若(Esther Duflo)夫妇和哈...
linux:最常见的linux命令(centOS 7.6)
最常见,最频繁使用的20个基础命令如下: 皮一下,这都是干货偶,大佬轻喷 一、linux关机命令: 1.shutdown命令安全地将系统关机(推荐)参数说明: [-r] 重启计算器。 [-h] 关机后关闭电源〔halt〕。 [-c] cancel current process取消目前正在执行的关机程序。 [-time] 设定关机〔shutdown〕前的时间。 shutdown -h now ...
只因写了一段爬虫,公司200多人被抓!
“一个程序员写了个爬虫程序,整个公司200多人被端了。” “不可能吧!” 刚从朋友听到这个消息的时候,我有点不太相信,做为一名程序员来讲,谁还没有写过几段爬虫呢?只因写爬虫程序就被端有点夸张了吧。 朋友说,消息很确认并且已经进入审判阶段了。 01.对消息进一步确认 朋友认识几个律师朋友,和他们有一些业务来往,得知他们想尝试把业务扩展到程序员这个群体。那段时间我刚好离职也有时间,在朋友...
相关热词 c#该名称在封闭局部范围 c#泛型 排序 c# 测试连接mysql c# 多线程 调用界面值 c# gdi unity c#反射构造带参对象 一起自学c# c#工厂方法 c# 对象属性保存xml u3d用c#写拾取物品