> 文章列表 > softmax激活函数(softmax 损失函数为什么不用均方误差)

softmax激活函数(softmax 损失函数为什么不用均方误差)

softmax激活函数(softmax 损失函数为什么不用均方误差)

关于softmax激活函数,softmax 损失函数为什么不用均方误差这个很多人还不知道,今天小六来为大家解答以上的问题,现在让我们一起来看看吧!

1、先理解max. 对一个三类问题,某样本经过NN处理后,最后一层输出值为[24,3,0.1]的话,那么经过max之后的结果为[1,0,0]。

2、对不?(至于为啥要max,输出结果本来挺奇怪 经过max以后就是categorical 的了,那么样本的类标就可以和他的预测值一起合体 直观地计算cost function。

3、)我们最需要的其实是max,但是max有个缺点就是不可导,没法用在dp里,于是有人就想出了softmax。

4、思路就是指数级扩大最后一层的输出,每个值都会增大,然而最大的那个值相比其他值扩大的更多,然后归一化一下,考虑一下极限,如果最大值x_1经过指数运算后想对其他值为无穷大,那么exp(x_1)/exp(x_1)+others =1,其他输出值对应的为0。

5、所以softmax模拟了max的行为,同时他还可导。

本文到此分享完毕,希望对大家有所帮助。