关于南瓜书中LDA线性判别分析推导的疑问
西瓜书P63中给出了LDA多分类问题的最优化目标

南瓜书中将其转化为条件极值:

然后定义了对应的拉格朗日函数

到这里还是能理解的,但是南瓜书上又重新定义了一个拉格朗日函数:

第一个拉格朗日函数是根据定义得出的,但是第二个拉格朗日函数是怎么得到的?看书上写的两个方程化简的结果也不一样啊?我自己尝试理解这个式子的想法是A^TB的迹是A和B对应元素相乘后相加,Lambda是对角阵,I是单位阵,取迹之后就是lambdai与W^T*S*W-I的对应对角线元素相乘求和,所以上式的约束就是W^T*S*W的对角线元素均为1?请问我的这个理解是哪里出错了呢?