损失函数用的是带正则化的均方误差mse,对2个参数利用随机梯度下降进行迭代,然后下面图横轴是迭代次数,纵轴就是均方误差mse,有点不明白 1、为啥先下降后上升,不应该一直下降直到区域平缓吗?2、是否我梯度下降实现错了呢?这正常吗,一开始我写的终止循环条件是本次迭代的mse和上一轮迭代的mse差的绝对值小于0.01,那么基本上10次以内就达到这个条件然后就退出了,如果这个图正常,3、那我实际该如何写终止条件了,因为我还有别的一个参数要变动,那个参数我得依据实验效果也就是这个mse选取最优的,但是这下好了,我连这个图都看不明白,有几个疑问,请指教