如何使用LSTM和Transform等经典模型

最近在学习自然语言处理的预训练语言模型，然后最近看了LSTM和Transform，然后我l师给我说这几个比较经典，需要会用，而且我后面还要学习bert，但是我学的不好我不知道咋用，只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗？还是需要我搞个tensorflow深度学习平台吗？还是怎么地呀？求各位指点迷津😭😭

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2022-10-13 09:50
关注
建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1.x版本的，有些会有大佬重写2.x版本的代码，有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了，自己去编译旧版本也没啥意义，还折腾。
至于学习，你可以找别人代码跑，在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建，从0开始，数据加载，数据预处理增强，损失函数设计等等，而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

机器学习：使用LSTM训练情感分析模型
2025-07-29 14:28

码农Q！的博客 • 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；至此，根据训练集训练...
LSTM模型
2024-08-07 15:23

Ice-cream-AI的博客 LSTM（长短期记忆）是一种用于处理和预测时间序列数据的递归神经网络（RNN）架构旨在解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。LSTM的关键在于其特殊的单元结构，每个单元包含三个门：输入门、...
时序预测：使用LSTM和Transformer模型
2024-12-15 07:37

鱼弦的博客长短期记忆网络（LSTM）是一种特殊的递归...LSTM和Transformer模型在时间序列预测中各有优势，前者擅长处理顺序依赖性强的任务，后者则在长距离依赖和并行计算上表现优异。选择具体模型需要基于数据特点和应用场景。
使用 LSTM/GRU 预测设备异常的模型
2025-05-16 16:35

培根芝士的博客 LSTM 和 GRU 都被广泛应用于自然语言处理、时间序列预测、语音识别等领域。LSTM 由于其强大的长期依赖建模能力，在需要处理长序列数据时通常表现更好，但计算成本较高。而 GRU 在一些对实时性要求较高或计算资源有限...
AI人工智能领域LSTM：助力智能应用升级
2025-05-03 03:51

光子AI的博客随着人工智能技术的快速发展，序列数据处理需求日益增长，如自然语言、时间序列、语音信号等。传统循环神经网络（RNN）在处理长序列时面临梯度消失/爆炸问题，导致长期依赖信息难以捕捉。LSTM（Long Short-Term ...
AI人工智能领域LSTM的多模态融合应用
2025-07-13 03:20

AI架构师小马的博客而AI要实现真正的"智能"，也需要学会处理多模态数据。LSTM（长短期记忆网络）作为序列数据处理的"老专家"，能有效捕捉文本、语音、视频帧等序列数据中的时间依赖关系，成为多模态融合的核心工具之一。
使用 PyTorch 构建 LSTM 股票价格预测模型
2024-10-14 14:47

陌北v1的博客在金融领域，股票价格预测是一个重要且具有挑战性的任务。随着深度学习的发展，长...本篇博客将指导你如何使用PyTorch构建一个LSTM模型来预测股票价格，我们将逐步介绍数据预处理、模型训练和结果可视化的完整流程。
使用LSTM和Transformer模型进行时间序列数据的预测
2023-09-18 09:56

程序代码工程师的博客然后，我们构建了一个包含两个LSTM层和一个全连接层的LSTM模型，并使用均方误差作为损失函数进行编译和训练。通过适当的数据预处理和模型构建，我们可以利用这些模型来学习时间序列数据中的模式，并进行未来值的预测...
R使用深度学习LSTM构建时间序列预测模型
2024-05-27 10:34

statistics.insight的博客 R使用深度学习LSTM构建时间序列预测模型
用AI预测股市：手把手教你用LSTM打造股票价格预测模型
2025-01-21 21:37

yang_csdn_2025的博客我们使用PyTorch来构建LSTM模型。模型的输入维度为1（收盘价），隐藏层维度为32，输出维度为1（预测的收盘价）。return out。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月12日

如何使用LSTM和Transform等经典模型

1条回答 默认 最新

问题事件

1条回答默认最新