西瓜书 周志华 2016 年 12 月第 14 次印刷
3.1 基本形式
线性模型的预测函数为:
写成向量模式得到:
3.2 线性回归
线性回归能在给定数据集 ,其中 学到一个线性模型从而进行预测。
考虑最简单情况,当 为一维时,问题转换为求下式:
使得
使用平方损失函数作为衡量线性规划模型性能的指标, 与 越接近,代表平方损失函数越小。即得到:
西瓜书 周志华 2016 年 12 月第 14 次印刷
线性模型的预测函数为:
写成向量模式得到:
线性回归能在给定数据集 ,其中 学到一个线性模型从而进行预测。
考虑最简单情况,当 为一维时,问题转换为求下式:
使得
使用平方损失函数作为衡量线性规划模型性能的指标, 与 越接近,代表平方损失函数越小。即得到:
西瓜书 周志华 2016 年 12 月第 14 次印刷
机器学习:利用经验来决策
根据数据是否拥有标记信息分类:
假设空间指的是所有跟问题相关的假设所组成的空间,学习过程是从假设空间中进行搜索,目标是找到与训练集「匹配」(fit)的假设。
在这么多的假设中,可能存在一些假设,得出的结果和训练集一致,这些假设组成的空间叫做「版本空间」(version space)。
对于数据集中没有出现过的情况,算法可能会按照自己的偏好来预测结果,这种情况称为「归纳偏好」。为算法选取偏好时,可以使用「奥卡姆剃刀」原则,即有多个假设与观察一致,则选最简单的那个。但是什么是最简单的也需要仔细思考。
其他科学研究中采用的假设选择原则
古希腊哲学家伊壁鸠鲁 「多释原则」:保留与经验观察一致的原则。