暑假在和导师研究White-Box Transformers via Sparse Rate Reduction 这篇论文,
七月份到现在过去已经一个月了,我一开始是深度学习基本不懂的,但是有一点python基础,照着论文复现了实验,但是准确率有差异。
导师给我指明说要发论文的核心点就在于提升这个模型的性能和精读。看这篇the state of art的论文我真的不知道怎么完成这个目的,所以想去看title那本书补基础,目前学到了丢弃法了。
但是我今天和我导师汇报的时候,他说我学这玩意儿没啥用,就是一个说明手册,说我学了跟我发论文也没啥关系。
可是我觉得基础真的很重要啊,没有了解一些基本的东西怎么研究最新的东西。我就有点憋屈但又只能认同。
他的想法是说我一个月过去了还没有特别大的改变,他的理解是这篇论文确实对我很难,直接读比较难,但是论文开源了代码,但是可以通过观察打印每一层输入图像的数组的变换作为突破口,然后研究他的loss。我觉得是可以接受的这样的想法,但是他说我读那本书没用真的对吗?没有基础直接上高层,我真的不太喜欢这样
大三上,导师说<<动手学深度学习>>没用?
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-