锅小果 2022-10-12 20:31 采纳率: 60%
浏览 23
已结题

如何使用LSTM和Transform等经典模型

最近在学习自然语言处理的预训练语言模型,然后最近看了LSTM和Transform,然后我l师给我说这几个比较经典,需要会用,而且我后面还要学习bert,但是我学的不好我不知道咋用,只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗?还是需要我搞个tensorflow深度学习平台吗?还是怎么地呀?求各位指点迷津😭😭

  • 写回答

1条回答 默认 最新

  • 爱晚乏客游 2022-10-13 09:50
    关注

    建议换pytorch,信我,tensorflow坑巨多,还有各个版本之间的api兼容性,cuda兼容性巨差,旧版本的代码(1.08-1.15)在新版本(2.x)基本上跑不动,而一些旧的代码基本上都是1.x版本的,有些会有大佬重写2.x版本的代码,有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了,自己去编译旧版本也没啥意义,还折腾。
    至于学习,你可以找别人代码跑,在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建,从0开始,数据加载,数据预处理增强,损失函数设计等等,而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 3月22日
  • 已采纳回答 3月14日
  • 修改了问题 10月12日
  • 创建了问题 10月12日

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助