锅小果 2022-10-12 20:31 采纳率: 60%
浏览 28
已结题

如何使用LSTM和Transform等经典模型

最近在学习自然语言处理的预训练语言模型,然后最近看了LSTM和Transform,然后我l师给我说这几个比较经典,需要会用,而且我后面还要学习bert,但是我学的不好我不知道咋用,只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗?还是需要我搞个tensorflow深度学习平台吗?还是怎么地呀?求各位指点迷津😭😭

  • 写回答

1条回答 默认 最新

  • 爱晚乏客游 2022-10-13 09:50
    关注

    建议换pytorch,信我,tensorflow坑巨多,还有各个版本之间的api兼容性,cuda兼容性巨差,旧版本的代码(1.08-1.15)在新版本(2.x)基本上跑不动,而一些旧的代码基本上都是1.x版本的,有些会有大佬重写2.x版本的代码,有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了,自己去编译旧版本也没啥意义,还折腾。
    至于学习,你可以找别人代码跑,在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建,从0开始,数据加载,数据预处理增强,损失函数设计等等,而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 3月22日
  • 已采纳回答 3月14日
  • 修改了问题 10月12日
  • 创建了问题 10月12日

悬赏问题

  • ¥30 vb net 使用 sendMessage 如何输入鼠标坐标
  • ¥200 求能开发抖音自动回复卡片的软件
  • ¥15 关于freesurfer使用freeview可视化的问题
  • ¥100 谁能在荣耀自带系统MagicOS版本下,隐藏手机桌面图标?
  • ¥15 求SC-LIWC词典!
  • ¥20 有关esp8266连接阿里云
  • ¥15 C# 调用Bartender打印机打印
  • ¥15 我这个代码哪里有问题 acm 平台上显示错误 90%,我自己运行好像没什么问题
  • ¥50 C#编程中使用printDocument类实现文字排版打印问题
  • ¥15 找会编程的帅哥美女 可以用MATLAB里面的simulink编程,用Keil5编也可以。