2.3 多类分类
在二元分类中,目标变量
在这种情况下,
我们引入
定义函数
其中,输入项向量
下面,我们令
为了记号的简洁,我们令
接下来我们对单个训练样本
损失函数,即整个训练集的负对数似然函数为
我们定义交叉熵损失函数
使用这个记号,我们可以把
交叉熵损失函数的梯度表达式极其简洁。如果令
其中
若将上面的梯度写成向量形式,则有
其中
其中
在计算出上面梯度的基础上,我们可以利用梯度下降法,使得损失函数
在二元分类中,目标变量
在这种情况下,
我们引入
定义函数
其中,输入项向量
下面,我们令
为了记号的简洁,我们令
接下来我们对单个训练样本
损失函数,即整个训练集的负对数似然函数为
我们定义交叉熵损失函数
使用这个记号,我们可以把
交叉熵损失函数的梯度表达式极其简洁。如果令
其中
若将上面的梯度写成向量形式,则有
其中
其中
在计算出上面梯度的基础上,我们可以利用梯度下降法,使得损失函数