吴恩达《机器学习》章节2单变量线性回归

1、模型描述

给定一组数据，如房屋的面积及其价格，根据给定的数据假设出一个模型，然后用来估计给定面积的房屋的价格。

m:训练样本的数量

x's：输入变量/特征

y's：输出变量/目标变量

（x，y）：训练样本

（xⁱ，yⁱ）：第i个训练样本，i表示样本中的第i行

h(θ）=θ₀+θ₁x ; 是一个线性函数，类似于y=ax+b；单变量线性回归：即只有一个变量（特征）

h是一个假设函数（由x→y的映射）其作用是预测y是关于x的线性函数；x：特征/输入变量

2、代价函数

损失函数（Loss/Error Function）：计算单个训练集的误差

代价函数（Cost Function）：计算整个训练集所有损失函数之和的平均值

代价函数又叫平方误差函数或平方误差代价函数

代价函数为：

目标函数为：

吴恩达《机器学习》章节2单变量线性回归

为了直观理解代价函数到底是在做什么，先假设θ₀=0,

吴恩达《机器学习》章节2单变量线性回归

上图中右侧J(θ₀，θ₁）

代价函数-直观理解

注：该部分由于涉及到了多变量成像，可能较难理解，要求只需要理解上节内容即可，该节如果不能较好理解可跳过。

给定数据集：

吴恩达《机器学习》章节2单变量线性回归

参数在θ₀

吴恩达《机器学习》章节2单变量线性回归

由于3-D图形不便于标注，所以将3-D图形转换为轮廓图(contour plot)，下面用轮廓图（下图中的右图）来作直观理解，其中相同颜色的一个圈代表着同一高度（同一J(θ)

吴恩达《机器学习》章节2单变量线性回归

大概在θ₀=0.12，θ₁=250

吴恩达《机器学习》章节2单变量线性回归

上图中最中心的点（红点），近乎为图像中的最低点，也即代价函数的最小值，此时对应

3、梯度下降

让计算机自动找出最小化代价函数时对应的θ值；

思想：开始的时候，随便选择一个参数组合（θ₀，θ₁，θ₂......θ_n），即起始点，计算代价函数。然后寻找下一个能使得代价函数下降最多的参数组合，不懂迭代，直到找到一个局部最小值。由于下降的情况只考虑当前参数组合周围的情况，所以无法确定当前的局部最小值是否就是全局最小值。不同的参数组合，可能会产生不同的局部最优值。如下图所示。

吴恩达《机器学习》章节2单变量线性回归