如何使用LSTM和Transform等经典模型

最近在学习自然语言处理的预训练语言模型，然后最近看了LSTM和Transform，然后我l师给我说这几个比较经典，需要会用，而且我后面还要学习bert，但是我学的不好我不知道咋用，只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗？还是需要我搞个tensorflow深度学习平台吗？还是怎么地呀？求各位指点迷津😭😭

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2022-10-13 09:50
关注
建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1.x版本的，有些会有大佬重写2.x版本的代码，有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了，自己去编译旧版本也没啥意义，还折腾。
至于学习，你可以找别人代码跑，在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建，从0开始，数据加载，数据预处理增强，损失函数设计等等，而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何使用LSTM和Transform等经典模型 lstm transformer 自然语言处理
2022-10-12 20:31

回答 1 已采纳建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
LSTM模型可以训练怎样的数据集？人工智能深度学习神经网络自然语言处理
2020-04-18 17:08

回答 1 已采纳 LSTM主要用来学习序列，并且序列的变化的影响因子和序列本身有关或者周期性波动。比如说文本预测，每天每周每年的销量别的也可以学，但是效果未必很好。
使用LSTM和Transformer模型进行时间序列数据的预测
2023-09-18 09:56

程序代码工程师的博客然后，我们构建了一个包含两个LSTM层和一个全连接层的LSTM模型，并使用均方误差作为损失函数进行编译和训练。通过适当的数据预处理和模型构建，我们可以利用这些模型来学习时间序列数据中的模式，并进行未来值的预测...
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
关于LSTM模型提取数据特征 tensorflow 人工智能深度学习自然语言处理
2020-04-24 23:35

回答 1 已采纳用fit训练，用predict预测－－－－－－－－－－－－－－－－－－－－－－－－－－－本来还想多说几句的，一看之前的回答都没有采纳。当我白说
【数据挖掘】使用 LSTM 进行时间和序列预测
2023-07-25 00:38

无水先生的博客本文示例是一个典型的时间序列处理办法，可以当作经典来用。读者可以多花一些时间消化该案例；事实表明，用LSTM这种工具不仅可以处理NLP，而且可以针对任何的时间序列，比如股票预测。
LSTM神经网络模型张量与变量维度不匹配 lstm python tensorflow
2023-04-03 17:51

回答 3 已采纳与之前模型的checkpoint路径重合，新建一个路径保存即可
找的lstm模型里没有学习率这个参数 python
2021-07-21 10:15

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 请看👉 ：深度学习-利用LSTM预测多输出如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
pytorch训练LSTM模型的代码疑问 python 人工智能深度学习神经网络
2019-08-09 11:55

回答 2 已采纳 ``` def __init__(self): super(Sequence,self).__init__() self.lstm1 = nn.LSTMCel
使用LSTM模型进行股票价格预测
2023-07-02 22:51

练习两年半的工程师的博客我们在for loop的第一步，将数据集的前60个数据作为training ...下一步我们把数据类型转换为numpy array，并改变数据的shape，令它符合LSTM模型的输入要求。我们可以使用一支股票最后60天的数据来预测未来一天的股价。
在pytorch中，使用cnn+lstm用于分类 python 有问必答深度学习神经网络
2021-05-29 00:45

回答 2 已采纳可以参考这篇文章，希望对你有帮助：pytorch实现用CNN和LSTM对文本进行分类_Alphapeople的博客-CSDN博客
机器学习实战8-基于XGBoost和LSTM的台风强度预测模型训练与应用
2023-07-01 20:58

微学AI的博客大家好，我是微学AI，今天给大家介绍一下机器学习实战8-基于XGBoost和LSTM的台风强度预测模型训练与应用，今年夏天已经来了，南方的夏天经常会有台风登陆，给人们生活带来巨大的影响，本文主要基于XGBoost模型和长...
LSTM模型预测股票价格
2023-10-21 20:19

小渝儿ya的博客围绕 LSTM（Long Short-Term Memory）神经网络的原理，展示如何使用Python和深度学习库Keras构建LSTM模型，以及如何使用这个模型来预测时间序列数据。以股票价格预测为例，这是LSTM在金融领域的常见应用。LSTM 用于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月12日

悬赏问题

¥15 linux驱动，linux应用，多线程
¥20 我要一个分身加定位两个功能的安卓app
¥15 基于FOC驱动器，如何实现卡丁车下坡无阻力的遛坡的效果
¥15 IAR程序莫名变量多重定义
¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助

如何使用LSTM和Transform等经典模型

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新