【深度学习与实战】2.3、线性回归模型与梯度下降法先导案例--最小二乘法(向量形式求解)
为了求解损失函数 对
的导数,并利用最小二乘法向量形式求解
的值
这是线性回归的平方误差损失函数,目标是最小化预测值 与真实值
之间的差距。
损失函数:
考虑多个样本的情况,损失函数为所有样本的平方误差之和:
是损失函数
是
的设计矩阵(
个样本,
个特征)。
是
的权重向量。
是
的目标值向量。
- 对于两个列向量
和
,它们的点积(内积)就是
,
是向量
的转置
针对
函数求导,有一下性质:
对每项求导
第一项 
将 公式代入得
其中 为
,
为
,
为
。
第二项 
将 公式代入得
其中 为
,
为
第三项 
将 代入得
其中 为
,
为
第四项 没有
看作常数项 常数项的导数为0
合并项得
令
,得
(
可逆时)
和
互为逆矩阵
得出结果
解释:
,
与
互逆
逆矩阵的定义
如果 是
的逆矩阵,则满足:
(单位矩阵 类似于数值乘法中的 1)
即无论 左乘还是右乘
,结果均为单位矩阵。
必要条件
和
必须是方阵(行数=列数)
必须可逆(即行列式
)
直观理解
逆矩阵的作用类似于“倒数”。例如,数值中 ,类似地,矩阵中
。
单位矩阵 在矩阵乘法中的作用类似于数值乘法中的 1。
示例验证
取矩阵 ,其行列式
,故可逆。
计算逆矩阵:
(1) 第一行第一列的元素 (
)
(2) 第一行第二列的元素 (
)
(3) 第一行第二列的元素 (
)
(4) 第一行第二列的元素 (
)