最近在学习自然语言处理的预训练语言模型,然后最近看了LSTM和Transform,然后我l师给我说这几个比较经典,需要会用,而且我后面还要学习bert,但是我学的不好我不知道咋用,只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗?还是需要我搞个tensorflow深度学习平台吗?还是怎么地呀?求各位指点迷津😭😭
如何使用LSTM和Transform等经典模型
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- 爱晚乏客游 2022-10-13 09:50关注
建议换pytorch,信我,tensorflow坑巨多,还有各个版本之间的api兼容性,cuda兼容性巨差,旧版本的代码(1.08-1.15)在新版本(2.x)基本上跑不动,而一些旧的代码基本上都是1.x版本的,有些会有大佬重写2.x版本的代码,有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了,自己去编译旧版本也没啥意义,还折腾。
至于学习,你可以找别人代码跑,在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建,从0开始,数据加载,数据预处理增强,损失函数设计等等,而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 素材场景中光线烘焙后灯光失效
- ¥15 请教一下各位,为什么我这个没有实现模拟点击
- ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
- ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
- ¥20 有关区间dp的问题求解
- ¥15 多电路系统共用电源的串扰问题
- ¥15 slam rangenet++配置
- ¥15 有没有研究水声通信方面的帮我改俩matlab代码
- ¥15 ubuntu子系统密码忘记
- ¥15 保护模式-系统加载-段寄存器