最近在学习自然语言处理的预训练语言模型,然后最近看了LSTM和Transform,然后我l师给我说这几个比较经典,需要会用,而且我后面还要学习bert,但是我学的不好我不知道咋用,只是大概清楚了基本原理和架构。
是需要我找个代码跑一跑就行吗?还是需要我搞个tensorflow深度学习平台吗?还是怎么地呀?求各位指点迷津😭😭
![](https://profile-avatar.csdnimg.cn/869ac94bce5b40fb997aed747e852a43_m0_51507361.jpg!4)
如何使用LSTM和Transform等经典模型
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- 爱晚乏客游 2022-10-13 09:50关注
建议换pytorch,信我,tensorflow坑巨多,还有各个版本之间的api兼容性,cuda兼容性巨差,旧版本的代码(1.08-1.15)在新版本(2.x)基本上跑不动,而一些旧的代码基本上都是1.x版本的,有些会有大佬重写2.x版本的代码,有些就没有。你显卡要是30系的cuda只能装11.x的基本上跑不了,自己去编译旧版本也没啥意义,还折腾。
至于学习,你可以找别人代码跑,在别人的基础上调整一些网络的超参数看下这些超参数作用。然后主要的是要自己动手搭建,从0开始,数据加载,数据预处理增强,损失函数设计等等,而如果不会搭建至少也要会根据具体需求在别人的网络里修改一些网络结构或者模块等等。本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 latex投稿显示click download
- ¥15 请问读取环境变量文件失败是什么原因?
- ¥15 在若依框架下实现人脸识别
- ¥15 网络科学导论,网络控制
- ¥100 安卓tv程序连接SQLSERVER2008问题
- ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
- ¥15 metadata提取的PDF元数据,如何转换为一个Excel
- ¥15 关于arduino编程toCharArray()函数的使用
- ¥100 vc++混合CEF采用CLR方式编译报错
- ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?