锅小果 2022-10-12 20:31 采纳率: 60%
浏览 25
已结题

如何使用LSTM和Transform等经典模型

最近在学习自然语言处理的预训练语言模型,然后最近看了LSTM和Transform,然后我l师给我说这几个比较经典,需要会用,而且我后面还要学习bert,但是我学的不好我不知道咋用,只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗?还是需要我搞个tensorflow深度学习平台吗?还是怎么地呀?求各位指点迷津😭😭

  • 写回答

1条回答 默认 最新

  • 爱晚乏客游 2022-10-13 09:50
    关注

    建议换pytorch,信我,tensorflow坑巨多,还有各个版本之间的api兼容性,cuda兼容性巨差,旧版本的代码(1.08-1.15)在新版本(2.x)基本上跑不动,而一些旧的代码基本上都是1.x版本的,有些会有大佬重写2.x版本的代码,有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了,自己去编译旧版本也没啥意义,还折腾。
    至于学习,你可以找别人代码跑,在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建,从0开始,数据加载,数据预处理增强,损失函数设计等等,而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 3月22日
  • 已采纳回答 3月14日
  • 修改了问题 10月12日
  • 创建了问题 10月12日

悬赏问题

  • ¥50 用logisim设计16位单时钟周期cpu
  • ¥15 IDEA中圈复杂度如何具体设置
  • ¥50 labview采集不了数据
  • ¥15 请上面代码做什么处理或什么混淆
  • ¥15 英雄联盟自定义房间置顶
  • ¥15 W5500网线插上无反应
  • ¥15 如何用字典的Key,显示在WPF的xaml中
  • ¥15 weautomate读取Excel表格信息然后填写到网页一直报错,如何解决?
  • ¥15 C#如何在Webview2中获取网页验证码
  • ¥15 esp32烧录失败,具体情况在图片上