自己之前主要从事服务器相关开发,现在和其他部门合作一些深度网络相关的项目,主要是音频领域的,比如声纹,音频语种,音频生成文字之类的,我能看到对方的代码和模型。我现在想学习这块,具体就是这个模型是什么思路,为什么这样一个模型训练训练就能解决这个问题
感觉通过看对方模型结构也解答不了这个问题。这块有啥建议么
自己之前主要从事服务器相关开发,现在和其他部门合作一些深度网络相关的项目,主要是音频领域的,比如声纹,音频语种,音频生成文字之类的,我能看到对方的代码和模型。我现在想学习这块,具体就是这个模型是什么思路,为什么这样一个模型训练训练就能解决这个问题
感觉通过看对方模型结构也解答不了这个问题。这块有啥建议么
建议先学习一下相关数学知识,这样可以知道为什么要计算这个loss或这个acc为什么要这么算出来。至于说模型为什么起作用,主要还是要看对应的paper来了解当初最原始的基础结构是如何实现的。大部分的工作都是在原始大佬的模型上加了或改了点东西。一路看下来就能快速理解为什么这么做了。另一方面看其他模型也能发现很多的工作都大同小异。如有帮助请采纳