[吴恩达机器学习]3·正规方程解多元线性回归

吴恩达机器学习系列课程：https://www.bilibili.com/video/BV164411b7dx

正规方程

说白了，这就是用我们在微积分中学习的多元微分学知识直接解出答案。

对于代价函数： $J (θ) = J (θ_{0}, θ_{1}, \dots, θ_{n})$ 如果它是连续的，那么要求出它的最小值，只需要令各偏导为零，就能得到 $θ$ 的值： $\frac{\partial J}{\partial θ_{j}} = 0, j = 0, 1, \dots, n$ 或写作向量形式： $\frac{\partial J}{\partial θ} = \vec{0}$ 下面我们就来对多元线性回归的代价函数解一解。

多元线性回归的代价函数为： $J (θ) = \frac{1}{2 m} \sum_{i = 1}^{m} {(θ^{T} x^{(i)} - y^{(i)})}^{2}$ 于是其偏导函数为： $\frac{\partial J}{\partial θ} = \frac{1}{m} \sum_{i = 1}^{m} (θ^{T} x^{(i)} - y^{(i)}) x^{(i)}$ 要使之为零向量，只能是： $θ^{T} x^{(i)} = y^{(i)}, i = 1, 2, \dots, m$ 恒成立。写作矩阵为： $X θ = y$ 其中， $X = [\begin{matrix} x_{0}^{(1)} & x_{1}^{(1)} & \dots & x_{n}^{(1)} \\ x_{0}^{(2)} & x_{1}^{(2)} & \dots & x_{n}^{(2)} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ x_{0}^{(m)} & x_{1}^{(m)} & \dots & x_{n}^{(m)} \end{matrix}] = [\begin{matrix} {x^{(1)}}^{T} \\ {x^{(2)}}^{T} \\ ⋮ \\ {x^{(m)}}^{T} \end{matrix}], y = [\begin{matrix} y^{(1)} \\ y^{(2)} \\ ⋮ \\ y^{(m)} \end{matrix}]$ 两边同时乘以 $X^{T}$ ，假设 $X^{T} X$ 可逆，解得： $θ = (X^{T} X)^{- 1} X^{T} y$ 这就是数学上多元线性回归方程的精确解。

这里， $X^{T} X$ 是一个 $(n + 1) \times (n + 1)$ 的矩阵，因此直接计算 $θ$ 的复杂度是 $O (n^{3})$ 的，如果 $n$ 不是很大，这是有效的，但是如果 $n$ 达到了 $10^{4}, 10^{5}$ 或更高级别，就需要使用梯度下降了。

实现

仍然对第二篇中的多元线性回归数据进行求解。

代码很简洁：

import numpy as np

def J(T, X, Y):
	res = 0
	for i in range(m):
		res += (np.matmul(T.T, X[i:i+1, :].T) - Y[i:i+1, :]) ** 2
	res /= 2 * m;
	return res

data = np.genfromtxt("ex1data2.txt", delimiter = ',')
(m, n) = data.shape
X = np.column_stack((np.ones((m, 1)), data[:, :-1]))
Y = data[:, -1:]
T = np.matmul(np.matmul(np.linalg.inv(np.matmul(X.T, X)), X.T), Y)
print(T)
print(J(T, X, Y))
PYTHON

很快给出了结果：.

不可逆情形

前一节的推导基于可逆的假设，如若不可逆，我们只需将代码中的 inv() 换成 pinv() 求出伪逆矩阵即可。

import numpy as np

def J(T, X, Y):
	res = 0
	for i in range(m):
		res += (np.matmul(T.T, X[i:i+1, :].T) - Y[i:i+1, :]) ** 2
	res /= 2 * m;
	return res

data = np.genfromtxt("ex1data2.txt", delimiter = ',')
(m, n) = data.shape
X = np.column_stack((np.ones((m, 1)), data[:, :-1]))
Y = data[:, -1:]
T = np.matmul(np.matmul(np.linalg.pinv(np.matmul(X.T, X)), X.T), Y)
print(T)
print(J(T, X, Y))
PYTHON

课程书籍笔记 > Andrew Ng ML

#machine learning

[吴恩达机器学习]3·正规方程解多元线性回归

https://xyfjason.github.io/blog-main/2020/12/22/吴恩达机器学习-3·正规方程解多元线性回归/

作者

xyfJASON

发布于

2020年12月22日

许可协议

[吴恩达机器学习]4·逻辑回归之二分类上一篇

[吴恩达机器学习]2·梯度下降解多元线性回归下一篇