dbn网络有监督，反向传播问题

做这个dbn是无监督学习效果很差，我给他加了标签，计算损失函数，但是反向传播维度不匹配，有佬知道怎么回事吗？
主要是激活函数这部分的问题，数据输入维度（3200，8）label（3200，1）
报错：


    H=x @ self.w+self.a.T
ValueError: matmul: Input operand 1 has a mismatch in its core dimension 0, with gufunc signature (n?,k),(k,m?)->(n?,m?) (size 2 is different from 1)

完整代码：

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from torchvision.datasets import MNIST
np.random.seed(2)
from tqdm import tqdm
import matplotlib.pyplot as plt
class RBM():
    def __init__(self,x_layer,h_layer):
        '''
        :param x_num: 可见层维度
        :param h_num: 隐藏层维度
        '''
        self.x_layer=x_layer #可见层的维度
        self.h_layer=h_layer #隐藏层的维度
        self.w=np.random.normal(0, 0.1, size=(self.x_layer, self.h_layer)) #从正态分布中随机采样w
        self.a=np.random.normal(0, 0.1, size=(self.h_layer,1)) #从正态分布中随机采样a
        self.b=np.random.normal(0, 0.1, size=(self.x_layer,1)) #从正态分布中随机采样b
        self.learning_rate=0.1 #学习率
    def train(self,x,K):
        '''
        :param x: 训练数据
        :param K: 使用k次吉布斯采样
        :return:
        '''
        x_num=x.shape[0] #样本的个数

        for _ in tqdm(np.arange(100),desc="梯度上升"): #梯度上升迭代10000次
            x0=x
            #################
            #CD-K吉布斯采样
            for _ in np.arange(K): #吉布斯采样K次

                P_h=self.sigmoid_Ph_x(x0) #从v0计算出P(h=1|v0)

                #从P(h=1|v0)采样出h0
                h0=np.random.binomial(1,p=P_h,size=(x_num,self.h_layer))
                #计算出P(v|h0)
                P_x=self.sigmoid_Px_h(h0)

                #采样出v
                x0=np.random.binomial(1,p=P_x,size=(x_num,self.x_layer))
            #################
            #真实数据的P(h=1|x)
            true_h =self.sigmoid_Ph_x(x)

            #采样数据的P(h=1|x)
            x_sample_h=self.sigmoid_Ph_x(x0)
            #w梯度
            w_GD=(x.T@true_h-x0.T@x_sample_h)/x_num

            #a梯度
            a_GD=np.mean(true_h-x_sample_h,axis=0).reshape(-1,1)

            #b梯度
            b_GD=np.mean(x-x0,axis=0).reshape(-1,1)

            #梯度下降
            self.w+=self.learning_rate*w_GD
            self.a+=self.learning_rate*a_GD
            self.b+=self.learning_rate*b_GD
    def sigmoid_Ph_x(self,x):
        '''
        计算P(h=1|x)
        :param x: 数据
        :return:
        '''
        print(x.shape)
        print(self.w.shape)
        H=x @ self.w+self.a.T
        result=1/(1+np.exp(-H))
        return result
    def sigmoid_Px_h(self,h):
        '''
        计算P(x=1|h)
        :param h:
        :return:
        '''
        H=(self.w @ h.T + self.b).T
        result=1/(1+np.exp(-H))
        return result

    # def sigmoid_Ph_x2(self,x):
    #     '''
    #     计算P(h=1|x)
    #     :param x: 数据
    #     :return:
    #     '''
    #     print(x.shape)
    #     print(self.w.shape)
    #     H=x @ self.w.T+self.a.T
    #     result=1/(1+np.exp(-H))
    #     return result
    #
    # def sigmoid_Px_h2(self,h):
    #     '''
    #     计算P(x=1|h)
    #     :param h:
    #     :return:
    #     '''
    #     H=(self.w @ h.T + self.b).T
    #     result=1/(1+np.exp(-H))
    #     return result


class DBN():
    def __init__(self, layer):
        self.layer = layer
        layer_num = len(layer)  # 计算有多少层
        self.RBMS = []  # 储存多个受限玻尔兹曼机
        for i in np.arange(layer_num - 1):  # 迭代初始化多个受限玻尔兹曼机
            rbm = RBM(layer[i], layer[i + 1])
            self.RBMS.append(rbm)

    def train(self, data, labels, k, num_epochs):
        for epoch in range(num_epochs):
            for rbm in self.RBMS:  # 迭代训练每一个RBM
                rbm.train(data, k)  # 训练
                p = rbm.sigmoid_Ph_x(data)  # 计算出下一层的概率
                data = np.random.binomial(1, p, size=p.shape)  # 根据概率采样

            x_train = data
            y_train = labels

            # 计算预测结果
            x_train_pred = data  # 直接使用数据作为预测结果

            # 计算损失和梯度
            loss = self.cross_entropy_loss(y_train, x_train_pred)
            dW = np.zeros_like(self.RBMS[-1].w)
            da = np.zeros_like(self.RBMS[-1].a)
            db = np.zeros_like(self.RBMS[-1].b)

            # 反向传播
            for rbm in reversed(self.RBMS):
                dy = (x_train_pred - y_train) * rbm.sigmoid_Px_h(x_train)
                print(dy.shape)
                # print( "ceshi:",rbm.sigmoid_Ph_x2(data))
                dW += rbm.learning_rate * np.dot(dy.T, rbm.sigmoid_Ph_x(data))
                da += rbm.learning_rate * np.mean(dy, axis=0)
                db += rbm.learning_rate * np.mean(rbm.sigmoid_Ph_x(data) - x_train_pred, axis=0)

                # 更新数据
                x_train = rbm.sigmoid_Ph_x(x_train)

            # 更新权重
            self.RBMS[-1].w += dW
            self.RBMS[-1].a += da
            self.RBMS[-1].b += db

            # 打印损失和准确率
            print(
                f"Epoch {epoch + 1}/{num_epochs}, Loss: {loss}, Accuracy: {self.accuracy(y_train, x_train_pred)}")

    def cross_entropy_loss(self, y_true, y_pred):
        y_true = y_true.reshape(-1, 1)
        y_pred = y_pred.reshape(-1, self.layer[-1])
        loss = -np.mean(y_true * np.log(y_pred + 1e-7))  # 添加正则化以避免数值稳定性问题
        return loss

    def accuracy(self, y_true, y_pred):
        y_true = y_true.reshape(-1, 1)
        y_pred = np.argmax(y_pred, axis=1)
        return np.mean(y_true == y_pred)

    def predict(self, x):
        x = x.astype(float)
        for rbm in self.RBMS:
            p = rbm.sigmoid_Ph_x(x)
            x = np.random.binomial(1, p, size=p.shape)
        x = np.array(x)
        x_shape = x.shape
        x = x.flatten()
        x = self.RBMS[-1].softmax(x)
        x = x.reshape(x_shape)
        return x
if __name__ == '__main__':
    k=2
    data = pd.read_csv('merged.csv')
    X = data.drop('type', axis=1).values
    y = data['type'].values
    y = y.reshape(-1, 1)
    epochs = 10
    print(X.shape)
    print(y.shape)
    # 数据预处理
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    print(X_train.shape)
    print(X_test.shape)
    dbn = DBN([8, 4, 2,1])  # 初始化，第一层1000神经元，第二场1000，以此类推
    dbn.train(X_train, y_train, k, epochs)  # 训练
    result = dbn.predict(X_test)  # 预测

    # 打印预测结果
    print(result)

    # 计算准确率
    accuracy = dbn.accuracy(y_test, result)
    print(f"Accuracy: {accuracy}")
    print(result)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-07-25 17:56
关注
引自免费微信小程序：皆我百晓生

你的问题主要在于反向传播时的维度不匹配。在反向传播过程中，你需要确保所有的操作都有正确的维度。具体来说，报错信息表明你在计算矩阵乘法时，矩阵的维度不匹配。这可能是由于你在计算sigmoid_Ph_x函数时，矩阵乘法的方式不正确导致的。你需要确保你的矩阵乘法操作符合矩阵的维度要求。

对于你的代码问题，我建议你在sigmoid_Ph_x函数中进行如下修改：

将：

H = x @ self.w + self.a.T

改为：

H = np.dot(x, self.w) + self.a.T

np.dot()函数确保了正确的矩阵乘法操作。同时，你也需要确保在进行矩阵乘法之前，你的矩阵维度是正确的。你可能需要检查你的数据输入维度和权重矩阵的维度，确保它们在矩阵乘法中是兼容的。

另外，对于反向传播部分，你可能需要重新审视你的代码以确保所有的操作都有正确的维度。你需要确保dy的计算与你的网络结构相匹配，然后正确地传播梯度。这需要你清楚你的网络结构以及每一层的输出和输入维度。如果可能的话，你可以尝试使用调试工具（如Python的pdb）来检查每一层的输出和输入维度，以确保它们在反向传播过程中保持一致。

最后，关于激活函数部分的问题，我看到你在计算sigmoid_Px_h和sigmoid_Ph_x时都使用了类似的公式，但是在计算过程中使用了不同的矩阵乘法方式。你需要确保你在所有地方都使用了正确的矩阵乘法方式，以避免类似的问题。同时，你也需要确保你的激活函数在所有地方都有正确的输入和输出维度。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

深度置信网络DBN的数据输入形式 matlab 深度学习
2017-03-27 07:47

回答 1 已采纳 https://wenku.baidu.com/view/91e820b405087632311212dc.html
关于android APP开发中SQLITE数据库的问题 android sqlite 数据库
2016-04-19 11:18

回答 2 已采纳我公司屏蔽qq了，你加我微信t_523474087
SQL PDO计数带有3个参数的行 php sql
2012-08-22 20:18

回答 1 已采纳 You can activate the PDO debug and see if there's something wrong with your query: $con->setAt
cnn卷积神经网络反向传播,卷积神经网络维度变化
2022-08-07 22:17

阳阳2013哈哈的博客 1989年，燕乐存（YannLeCun）等人开始将1974年提出的标准反向传播算法[3]应用于深度神经网络，这一网络被用于手写邮政编码识别。尽管算法可以成功执行，但计算代价非常巨大，神经网路的训练时间达到了3天，因而无法...
致命错误：带有消息[重复]的未捕获异常'PDOException' mysql php
2014-05-25 12:57

回答 1 已采纳 /*** mysql hostname ***/ $hostname = 'localhost'; /*** mysql username ***/ $username = 'removed';
php数据库连接成功但是不能插入数据 mysql php 数据库有问必答
2022-02-08 02:26

回答 5 已采纳去掉圈出来的那句代码，用mysqli了干嘛又新建个PDO链接对象干嘛，没必要用PDO了有其他问题可以继续交流~
带有消息'SQLSTATE [HY000]的未捕获异常'PDOException' php sql
2012-07-08 16:35

回答 4 已采纳 Please add include('config.php');
神经网络之深度学习DBN
2023-12-29 16:12

懒猫gg的博客神经网络由大量的人工神经元相互连接进行计算，根据外界的信息改变自身的结构，主要通过调整神经元之间的权值来对输入的数据进行建模，最终具备解决实际问题的能力.人类自身就是一个极好的模式识别系统。人类大脑...
下拉列表在DB中显示表格 mysql php
2016-05-08 05:54

回答 1 已采纳 You need to use full php code here <?php ?>
Laravel 5.1后台任务，当挂钩到Azure Web作业时，查询数据库无法工作 azure mysql php
2016-10-20 15:17

回答 2 已采纳 It seems the internal PHP runtime in Web App doesn't have sufficient permission to access to MySQL
下拉表格以显示内容 mysql php
2016-05-08 07:30

回答 1 已采纳 @gentlebreeze - my eyes hurt from trying to read that - but I can't see where you are actually set
在Zephir中使用PDO php
2015-02-01 05:22

回答 1 已采纳 The var keyword in zephir is for variable declarations. If you assign a "simple" value like a stri
deep belief nets.zip_人工智能/神经网络/深度学习_matlab_
2021-08-09 22:56

微调阶段，整个网络作为一个有监督的多层感知器进行反向传播，以优化网络权重，提升分类性能。这个 ZIP 文件可能包含以下关键组件： 1. MATLAB 脚本：用于构建、训练和测试 DBN 的代码。 2. 数据集：语音和图像...
neural-networks.rar_人工智能/神经网络/深度学习_Visual_C++_
2021-08-11 23:53

2.4 深度信念网络（DBN）与自编码器（AE）：预训练方法，通过无监督学习初始化权重，再进行有监督学习，提高模型的泛化能力。三、Visual C++中的神经网络实现 3.1 MFC框架：Visual C++的MFC库提供了丰富的用户...
深度信念网络（DBN）介绍
2024-04-19 16:13

第欧根尼的酒桶的博客这种网络结构在2006年由Geoffrey Hinton和他的研究小组首次提出，旨在通过无监督学习有效地训练多层神经网络。DBN是一种深度神经网络，它包含多个层次，每一层都学习数据中的高级抽象特征。在DBN中，最底层是可见层...
Autoencoder_Code.zip_人工智能/神经网络/深度学习_matlab_
2021-08-11 14:14

标题中的"Autoencoder_Code.zip"指出这是一个关于自编码器（Autoencoder）的代码集合，主要应用于人工智能、神经网络和深度学习领域，且是用MATLAB编程语言实现的。描述中提到，这个压缩包包含了深信度网络（Deep ...
人工神经网络在分类问题中的应用.pdf
2021-09-26 09:18

自1955年首次提出人工智能的概念以来，神经网络的研究一直在不断推进，涉及了完善理论基础、提升预测准确性、增强网络稳定性、优化泛化能力和探索高级应用等多个方面。神经网络的起源可以追溯到对生物神经元的研究...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月25日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

dbn网络有监督，反向传播问题

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新