LSTM神经网络IMDB情感分析中，预测值全为0，如何解决？

在深度学习IMDB情感分析中，我搭建了LSTM神经网络，但是预测值全为0，检查了好几天没有发现是什么原因。。
我认为数据预处理的部分应该是没有太大问题的，应该是神经网络搭建出了问题，但是我不清楚问题出在哪
以下是代码，请大家帮忙查看是哪里出了问题：

import torch
import torchtext
import numpy as np
import matplotlib.pyplot as plt
import os
import nltk
import torch.utils.data as data
import torch.optim as optim
from torch import nn

#加载数据集并分词
def openFiles(path,stopwords):#取前1000个数据训练，标签正面情绪为1负面情绪为0
    files=os.listdir(path)[:1000]
    res=[]
    label = 0 if path.split('/')[-1]=='neg' else 1
    
    for file in files:
        '''添加标签，分词并去除停用词后加入res中'''
        temp=[label]
        with open(path+'/'+file,encoding='utf-8') as f:
            words=nltk.word_tokenize(f.read())
            words=[word for word in words if word.lower() not in stopwords]
            temp.append(words)
        res.append(temp)
    return res

stopwords = set(nltk.corpus.stopwords.words('english'))#加载停用词
train=openFiles('./aclImdb/train/neg',stopwords)+openFiles('./aclImdb/train/pos',stopwords)
test=openFiles('./aclImdb/test/neg',stopwords)+openFiles('./aclImdb/test/pos',stopwords)

print('done')

#词序列化并填充
temp={}
word_dic={}

word_dic['<PAD>']=0
word_dic['<UNK>']=1

for i in train:
    for word in i[1]:
        if word not in temp and len(word)>1 and word.isalnum() and word!='br':
            temp[word]=1
        elif word in temp and len(word)>1 and word.isalnum() and word!='br':
            temp[word]+=1
temp=dict(sorted(temp.items(),key=lambda x:x[1],reverse=True))
for i in temp.keys():
    if temp[i]>10:
        word_dic[i]=len(word_dic)

max_len=50
print(f'len dic={len(word_dic)}')

def padding(data,pad_num):
    for i in range(len(data)):
        if len(data[i][1])<pad_num:
            data[i][1]+=(['<PAD>']*(pad_num-len(data[i][1])))
        else:
            data[i][1]=data[i][1][:pad_num]
    return data

train_data=padding(train,max_len)
test_data=padding(test,max_len)
print('padding done')

def word2num(data,word_dic):
    for i in range(len(data)):
        for j in range(len(data[i][1])):
            if data[i][1][j] in word_dic.keys():
                data[i][1][j]=word_dic[data[i][1][j]]
            else:
                data[i][1][j]=word_dic['<UNK>']
    return data

train_data=word2num(train_data,word_dic)
test_data=word2num(test_data,word_dic)
print('word2num done')

#划分数据集
class MyDataset(data.Dataset):
    def __init__(self, data):
        self.data = data
    
    def __len__(self):
        return len(self.data)
    
    def __getitem__(self, index):
        label, feature = self.data[index]
        return torch.tensor(feature), torch.tensor(label)

train_dataset = MyDataset(train_data)
test_dataset = MyDataset(test_data)

#建立模型并训练
class ComEmoClass(nn.Module):
    def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim, n_layers,
                 bidirectional, dropout):
        super().__init__()
        self.embedding = nn.Embedding(vocab_size, embedding_dim,padding_idx=0)
        self.lstm = nn.LSTM(embedding_dim, hidden_dim, num_layers=n_layers,
                            bidirectional=bidirectional, dropout=dropout)
        self.fc = nn.Linear(hidden_dim*2, output_dim)

        
    def forward(self, text):

        embedded = self.embedding(text).squeeze(1)
        print(embedded.shape)

        output,_= self.lstm(embedded)

        output=output[:,-1,:]

        return self.fc(output.squeeze(0))

vocab_size = len(word_dic)
embedding_dim = 10
hidden_dim = 50
output_dim = 1
n_layers = 1
bidirectional = True


# 初始化模型
model = ComEmoClass(vocab_size, embedding_dim, hidden_dim, output_dim, n_layers,
            bidirectional,dropout=0)

criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)

# 实例化数据加载器
train_loader = data.DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = data.DataLoader(test_dataset, batch_size=64, shuffle=True)

num_epochs=10
for epoch in range(num_epochs):
    for i, (inputs, labels) in enumerate(train_loader):
        # 将数据送入模型进行训练
        
        labels=labels.unsqueeze(dim=1).float()
        #print(labels)
        inputs=inputs.unsqueeze(dim=1)#.permute(0,2,1)
        #print(inputs.shape)

        outputs = model(inputs)
        print(outputs)

        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # 打印每一次迭代的训练结果
        print('Epoch [{}/{}], Step [{}/{}], Loss: {}'.format(epoch+1, num_epochs, i+1, len(train_loader), loss.item()))

训练跑出来这样的结果：

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
=qewqer= 2023-05-04 17:09
关注
找到问题了，wssb，忘记给label转化成独热码了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Lstm神经网络能否调整输出层的节点数使其对于预测点输出两个值? matlab python 有问必答机器学习
2022-03-13 21:45

回答 2 已采纳肯定是可以的，keras的话调整搭建模型的输出层就行（layers.Dense(2)），matlab里的没咋用过，等别人回答~
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
请问一下LSTM长短时记忆网络可以用哪个软件编程呢？机器学习深度学习神经网络
2022-03-17 10:44

回答 1 已采纳 LSTM只是一个循环神经网络模型，市面上的各种深度学习框架都封装了的，你找个框架调API就行了，例如Pytorch和Tensorflow，Pytorch编程更小白一点。
NLP学习笔记-循环神经网络RNN、情感分类、LSTM（二）
2020-09-09 23:24

吃一口桃酥的博客循环神经网络和自然语言处理介绍 1. 文本的tokenization 1.1 概念和工具的介绍 tokenization就是通常所说的分词，分出的每一个词语我们把它称为token。常见的分词工具很多，比如： jieba分词：...
以chickenpox_dataset为例用Topsis算法比较LSTM算法与BP神经网络算法时的疑问 matlab 神经网络算法
2023-02-17 21:51

回答 2 已采纳方案来自梦想橡皮擦狂飙组基于 GPT 编写的 “程秘” 根据这项研究，LSTM算法与BP神经网络算法在chickenpox_dataset上的预测效果几乎没有差别。因此，可以认为代码方面没有问题
LSTM神经网络模型张量与变量维度不匹配 lstm python tensorflow
2023-04-03 17:51

回答 3 已采纳与之前模型的checkpoint路径重合，新建一个路径保存即可
神经网络预测误差，预测误差的分布人工智能深度学习神经网络
2022-11-28 14:30

回答 1 已采纳用同一个模型，预测值应该是一样的。如果是同一个网络训练出的不同模型，预测值可能不同。什么分布我也不知道，但差异应该很小。
【NLP】循环神经网络实现情感分类
2021-08-04 17:46

chaser&upper的博客循环神经网络实现文本情感分类1. Pytorch中LSTM和GRU模块使用1.1 LSTM介绍1.2 LSTM使用示例1.3 GRU的使用示例1.4 双向LSTM1.5 LSTM和GRU的使用注意点2. 使用LSTM完成文本情感分类2.1 修改模型2.2 完成训练和测试代码...
LSTM/RNN 中的time_step到底如何设置? python 神经网络自然语言处理
2020-05-31 21:21

回答 1 已采纳 time_step 和input_size的乘积已经和你的一条语句的编码长度相同。感觉应该是这样处理的，你可以参考一下：编码后每条数据： [[0,0,0,1,1],[1,0,1,0,0],[
无编程基础如何学习LSTM lstm rnn 神经网络
2022-01-27 14:51

回答 1 已采纳 1、因为未接触编程，所以有必要掌握至少一门编程语言。考虑到从事AI相关研究，建议学习Python，其次是C++；2、学习Pytorch框架，其有Python和C++接口，根据你学习的语言决定；3、学习
LSTM模型可以训练怎样的数据集？人工智能深度学习神经网络自然语言处理
2020-04-18 17:08

回答 1 已采纳 LSTM主要用来学习序列，并且序列的变化的影响因子和序列本身有关或者周期性波动。比如说文本预测，每天每周每年的销量别的也可以学，但是效果未必很好。
万字长文：深入理解各类型神经网络（简单神经网络，CNN，LSTM）的输入和输出
2021-01-28 15:34

我唱歌比较走心的博客简单神经网络 当输入为标量对于一个最简单的神经网络而言，它的一个神经元通常长这个样子：假设我们有a1, a2, ... , an共n个输入，对于每个输入都给定一个权重w1, w2, ... , wn，再给定一个偏置b，将权重和...
LSTM神经网络添加注意力机制 python 数据挖掘
2022-10-22 23:55

回答 1 已采纳不知道你具体代码，只能说你的affine_layer()这个函数有三个返回值的，但是你只用2个参数你接收，所以报错了。换成三个参数看看，类似A,B,C=affine_layer()如果你确定你只要两个
Python机器学习实战：基于文本数据进行情感分析
2024-04-23 13:08

AI天才研究院的博客 Python机器学习实战：基于文本数据进行情感分析 1.背景介绍 1.1 情感分析的重要性在当今时代,随着社交媒体、在线评论和用户反馈的激增,情感分析(Sentiment Analysis)已成为一项关键技术。它能够自动
循环神经网络和自然语言处理介绍||文本情感分类|| 循环神经网络||循环神经网络实现文本情感分类||Pytorch中的序列化容器
2021-08-28 21:18

Jason_Honey2的博客循环神经网络和自然语言处理介绍目标知道token和tokenization 知道N-gram的概念和作用知道文本向量化表示的方法 1. 文本的tokenization 1.1 概念和工具的介绍 tokenization就是通常所说的分词，分出的每一个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月4日

悬赏问题

¥15 无源定位系统的时差估计误差标准差
¥15 请问这个代码哪里有问题啊
¥20 python--version在命令端输入结果Python is not defined怎么办？还有pip不是exe格式是不是没安装成功？
¥15 通过GaussianView进行结构微调消除虚频
¥15 调用transformers库
¥15 由于导出的数据名字中带有/，导致Matlab打不开，怎么办？
¥15 新硬盘安装的程序总是崩溃，提示遇到错误
¥15 openpcdet自制数据集评估bev精度和3d精度相同
¥15 excel 上下按钮显示行
¥20 云卓h12pro 数传问题

LSTM神经网络IMDB情感分析中，预测值全为0，如何解决？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新