寻找一篇论文,内容有很多是讲怎么避免模型出现上溢下溢训练问题的,比如在pre-ln的基础上再加了一个ln,修改激活函数为relu等,最后有一句总结是这些细微的修改想一个个精密的齿轮使模型训练更加稳定之类的,我想找到底是哪一个
3条回答 默认 最新
阿里嘎多学长 2025-12-09 21:34关注阿里嘎多学长整理AIGC生成,因移动端显示问题导致当前答案未能完全显示,请使用PC端查看更加详细的解答过程
根据你的问题描述,我理解你想要寻找一篇关于避免模型上溢下溢训练问题的论文,特别是那些通过修改激活函数、添加额外的层等方式来提高模型稳定性的方法。
你可以尝试在以下资源中寻找相关论文:
- arXiv:一个著名的计算机科学和数学论文数据库。
- Google Scholar:一个全面的学术搜索引擎,可以帮助你找到相关论文。
- ResearchGate:一个社交网络平台,允许研究人员分享和发现论文。
- Academia.edu:一个在线学术平台,提供论文、研究和学术资源。
你也可以尝试使用以下关键词进行搜索:
- 模型上溢下溢
- 激活函数
- pre-ln
- ln
- ReLU
- 模型稳定性
- 自然语言处理
- 人工智能
- 机器学习
希望这些资源和关键词能够帮助你找到你想要的论文!
解决 无用评论 打赏 举报