UCI上面找的训练集的输入是连续的,而标签是离散的,我见别人的LOSS都是持续下降到0.00几的,我这个把学习率调到0.001,激活函数是sigmoid,但还是在1.几和0.几之间徘徊,这是正常现象吗?不是的话是哪里出问题了?
跪求大佬解答!!
UCI上面找的训练集的输入是连续的,而标签是离散的,我见别人的LOSS都是持续下降到0.00几的,我这个把学习率调到0.001,激活函数是sigmoid,但还是在1.几和0.几之间徘徊,这是正常现象吗?不是的话是哪里出问题了?
跪求大佬解答!!
这个和你数据本身的可学习性,模型的性能都有关系。比如说你的数据噪声很多,根本没有可预测性,那么你的loss肯定学来学去都很大。
所以你必须首先找到一个标准的数据样本,比如minist,imgnet等,然后使用和参照一样的模型,然后调整参数,才有对比的价值。