2.1 逻辑回归
现在我们来讨论分类问题。在导言中我们提到,目标变量为连续型随机变量的学习问题称为回归问题,目标变量为离散型随机变量的问题称为分类问题。为推导之便利,我们在此只研究目标变量取值为
逻辑回归
我们大可以忽略
我们需要对假设函数的值域进行修正。定义
其中
称为逻辑函数或 S- 型函数。
可以注意到,
像之前一样,我们设
下面我们研究逻辑函数的一些有趣的性质:导数的特征。
接下来,我们将利用这一性质,导出随即逻辑回归的算法。
首先,仿照线性回归的概率解释,我们先假设:
两个式子可统一为
故似然函数为
我们的目标是找出使
接下来我们对
上式第二个等号利用了链式求导法则及逻辑函数导数的特点。
由此,根据梯度上升(因为我们要最大化对数似然函数,应该顺着梯度的方向改变
写成向量形式:
可以发现,这和随机线性回归的公式在形式上是一模一样的!但事实上它们是两种完全不同的算法,因为
另一种记号
下面我们给出另一种记号体系,它同样是非常有用的。
记
易见它是对数似然函数的相反数:
有时
由链式法则,可得
这与上面推导的结果相一致。