-
监督学习(训练数据拥有标记信息)
- 分类:预测离散值
- 聚类:预测连续值
-
无监督学习(训练数据不含标记信息)
- 聚类:
-
独立同分布:i.i.d.
-
归纳(induction):从特殊到一般的泛化
- 广义归纳学习:从样例中学习
- 狭义归纳学习:从训练数据中学到概念(很难)
-
演绎:从一般到特殊,即从基础原理推演出具体情况
-
ote的含义:off training error,训练集外的误差
-
统计学习三要素:模型+策略+算法,模型确定了,假设空间也就确定了,算法就是从假设空间中搜索最优的假设,其中用到归纳偏好(策略)
-
L mathfrak{L} L:哥特体,德国的写法
-
公式1.1误差定义的方法:预测值与真实值一致误差则为0,否则误差为1
-
公式1.1的重要辅助理解:
假设为h(x)时误差期望为:
E = ∑ x ∈ X − X P ( x ) I ( h ( x ) ≠ f ( x ) ) E = sumlimits_{x in mathcal{X} - X}^{} {Pleft( x right)mathbb{I}left( {hleft( x right) ne fleft( x right)} right)} E=x∈X−X∑P(x)I(h(x)=f(x))



