最近学习一个mnist的训练,里面是这样写的:
xs,ys = mnist.train.next___batch(100)
而我看了一下mnist的单个数据是28*28的 而每次用一个batch的大小是100*784 我想请问一下一个batch是怎么训练的,是一个一个的28*28传入网络,还是100*784大小的数据全部传入网络? 如果是100*784传入,请问这个是怎么回事?
收起
每次都是输入1个图片,正向传播,计算损失函数,再100个作为整体来反向传播,调整权重
报告相同问题?