Tensorflow实现简单CNN模型中某一层shape的计算问题

RT,网上看到一篇资料，实现了一个简单的CNN模型，但是有个shape我有点蒙，不知道怎么算的，代码如下：
这是alexnet网络定义的部分，我们只需要修改这一部就可以了

 def alex_net(_X, _weights, _biases, _dropout):
    # Reshape input picture
    _X = tf.reshape(_X, shape=[-1, 28, 28, 1])

    # Convolution Layer
    conv1 = conv2d('conv1', _X, _weights['wc1'], _biases['bc1'])
    # Max Pooling (down-sampling)
    pool1 = max_pool('pool1', conv1, k=2)
    # Apply Normalization
    norm1 = norm('norm1', pool1, lsize=4)
    # Apply Dropout
    norm1 = tf.nn.dropout(norm1, _dropout)

    # Convolution Layer
    conv2 = conv2d('conv2', norm1, _weights['wc2'], _biases['bc2'])
    # Max Pooling (down-sampling)
    pool2 = max_pool('pool2', conv2, k=2)
    # Apply Normalization
    norm2 = norm('norm2', pool2, lsize=4)
    # Apply Dropout
    norm2 = tf.nn.dropout(norm2, _dropout)

    # Convolution Layer
    conv3 = conv2d('conv3', norm2, _weights['wc3'], _biases['bc3'])
    # Max Pooling (down-sampling)
    pool3 = max_pool('pool3', conv3, k=2)
    # Apply Normalization
    norm3 = norm('norm3', pool3, lsize=4)
    # Apply Dropout
    norm3 = tf.nn.dropout(norm3, _dropout)

    # Fully connected layer
    dense1 = tf.reshape(norm3, [-1, _weights['wd1'].get_shape().as_list()[0]]) # Reshape conv3 output to fit dense layer input
    dense1 = tf.nn.relu(tf.matmul(dense1, _weights['wd1']) + _biases['bd1'], name='fc1') # Relu activation

    dense2 = tf.nn.relu(tf.matmul(dense1, _weights['wd2']) + _biases['bd2'], name='fc2') # Relu activation

    # Output, class prediction
    out = tf.matmul(dense2, _weights['out']) + _biases['out']
    return out

# Store layers weight & bias
weights = {
    'wc1': tf.Variable(tf.random_normal([3, 3, 1, 64])),
    'wc2': tf.Variable(tf.random_normal([3, 3, 64, 128])),
    'wc3': tf.Variable(tf.random_normal([3, 3, 128, 256])),
    'wd1': tf.Variable(tf.random_normal([4*4*256, 1024])),
    'wd2': tf.Variable(tf.random_normal([1024, 1024])),
    'out': tf.Variable(tf.random_normal([1024, 10]))
}
biases = {
    'bc1': tf.Variable(tf.random_normal([64])),
    'bc2': tf.Variable(tf.random_normal([128])),
    'bc3': tf.Variable(tf.random_normal([256])),
    'bd1': tf.Variable(tf.random_normal([1024])),
    'bd2': tf.Variable(tf.random_normal([1024])),
    'out': tf.Variable(tf.random_normal([n_classes]))
}

# Construct model
pred = alex_net(x, weights, biases, keep_prob)

weights 项下的“wd1”，shape的输入处是4*4*256，4是怎么算出来的，学生自学所以不是很明白，各位帮忙解释一下

资料的网址：TensorFlow人工智能引擎入门教程之三实现一个自创的CNN卷积神经网络 - zhuyuping的个人空间
https://my.oschina.net/yilian/blog/661409

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2018-02-14 15:51
关注
http://blog.csdn.net/zj360202/article/details/70265414?locationNum=9&fps=1

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

tensorflow构建cnn后summary无法显示 cnn python tensorflow
2022-07-18 18:37

回答 2 已采纳问题已经解决了，果然是芯片问题（m1芯片不能直接pip install TensorFlow），有专门的适配版本，会比较麻烦，我直接换了一个Intel芯片的电脑就可以
关于模型的参数量计算问题 cnn 人工智能深度学习
2023-03-19 21:49

回答 2 已采纳参考GPT和自己的思路：可能是因为算法和计算参数量的方法不一样导致的。官方文档提供的参数量估计可能是基于模型结构和每个层的参数数量来估计的，而使用pytorch自带的方法计算参数量可能是考虑了某些参
CNN训练模型时遇到的问题，请问如何修改 cnn 机器学习神经网络
2023-02-15 17:17

回答 2 已采纳这个错误提示的意思是说，你正在将形状为 (1000, 160, 400) 的数据喂入形状为 (?, 160, 100) 的占位符中，而这两个形状是不匹配的。要解决这个问题，有两种可能的方法：修改
人工智能CNN 卷积神经网络结构（tensorflow代码实现）
2023-05-23 06:30

人工智能研究所的博客（手写数字识别是TensorFlow人工智能最基础的案例，这个跟学习编程语言的hello Word一样）具体每个步骤的含义，我们下期分享CNN如何来识别MNIST手写数字，来一起分享具体的过程。以上便是一个完整的CNN卷积神经网络...
关于CNN图像识别模型 cnn 人工智能深度学习
2023-03-08 14:47

回答 4 已采纳参考GPT和自己的思路：以下是针对您的需求对代码进行修改的版本： import torch.nn as nn import torch.nn.functional as F # define the
关于基于cnn的图像识别中，对于输入图像预处理的问题 tensorflow 人工智能机器学习深度学习神经网络
2019-12-18 09:11

回答 1 已采纳如果有些样本存在瑕疵（比如曝光不正确、不清晰）和别的样本不同，预处理下会更好，否则不需要。总之应该保证样本的一致性。
tensorflow CNN训练mnist数据集后识别自己写的数字效果不好 cnn tensorflow 神经网络
2018-04-15 16:32

回答 5 已采纳 MNIST数据集与你自己采集的图像，实际上是两个不同的数据集，你在MNIST上训练，然后在你的数据集上测试，测试性能不好是十分正常的。这实际上涉及在两个相似但是不同的域之间的迁移学习的问题。有三个办法
【TensorFlow】开始第一个CNN模型
2019-09-20 11:23

CZTSummer的博客这里将会用简短的代码基于tensorflow实现一个简单的CNN模型。tensorflow是目前业界使用的十分广泛的深度学习框架，尽管pytorch大有后来者居上的趋势，但是tensorflow在业界应用上的王者地位依然难以动摇，特别是在.....
tensorflow.keras训练预测模型输出一直都是直线 keras python tensorflow
2023-03-06 22:21

回答 3 已采纳可能是因为模型训练不充分或者数据集不够多造成的，可以尝试增加训练次数或者增加数据集来提高模型的准确性。同时，也可以检查一下模型的结构和参数是否设置合理。
如何让卷积神经网络中间的某几层参数固定，还不影响正常的训练过程? cnn 人工智能深度学习
2022-01-13 15:01

回答 1 已采纳可以啊，冻结之后只是不更新参数和计算梯度，优化器在step的时候遇到不计算梯度的话自动就不更新参数了，但是反向传播还是正常进行的。
Tensorflow相关问题 python tensorflow 深度学习
2022-04-09 16:19

回答 1 已采纳感觉是len(train_data) // batch_size
基于Tensorflow + Opencv 实现CNN自定义图像分类
2021-09-22 14:47

华为云开发者联盟的博客摘要：本篇文章主要通过Tensorflow+Opencv实现CNN自定义图像分类案例，它能解决我们现实论文或实践中的图像分类问题，并与机器学习的图像分类算法进行对比实验。本文分享自华为云社区《Tensorflow+Opencv实现CNN...
cv领域这两年最火的模型是什么 cnn 人工智能计算机视觉
2022-06-27 23:57

回答 1 已采纳 1.cv最火的是transform类似的相关模型: Swin Transformer, vit, mae, beit, DALLE，CLIP， DETR等等 2.看cv近几年的顶会论文就知道哪个结构最
（六）Tensorflow的CNN模型构建
2019-04-07 00:21

下一秒，待续的博客利用tensorflow的数据集，搭建CNN网络（2个卷积层，2个池化层，1个全连接层），实现了保存模型，断点续跑功能！ 1.代码展示 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_...
TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN
2023-12-26 12:15

AAI机器之心的博客卷积神经网络 CNN（Convolutional Neural Networks，ConvNet）是一种特殊的深度学习神经网络，近年来在物体识别、图像重绘、视频分析等多个层面得到了广泛的应用。
没有解决我的问题, 去提问

悬赏问题

¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算
¥15 java如何提取出pdf里的文字？