softmax激活函数(softmax 损失函数为什么不用均方误差)
关于softmax激活函数,softmax 损失函数为什么不用均方误差这个很多人还不知道,今天小六来为大家解答以上的问题,现在让我们一起来看看吧!
1、先理解max. 对一个三类问题,某样本经过NN处理后,最后一层输出值为[24,3,0.1]的话,那么经过max之后的结果为[1,0,0]。
2、对不?(至于为啥要max,输出结果本来挺奇怪 经过max以后就是categorical 的了,那么样本的类标就可以和他的预测值一起合体 直观地计算cost function。
3、)我们最需要的其实是max,但是max有个缺点就是不可导,没法用在dp里,于是有人就想出了softmax。
4、思路就是指数级扩大最后一层的输出,每个值都会增大,然而最大的那个值相比其他值扩大的更多,然后归一化一下,考虑一下极限,如果最大值x_1经过指数运算后想对其他值为无穷大,那么exp(x_1)/exp(x_1)+others =1,其他输出值对应的为0。
5、所以softmax模拟了max的行为,同时他还可导。
本文到此分享完毕,希望对大家有所帮助。