降维 | 学习笔记

降维

1.3 无监督学习

2019-06-17

| 机器学习 | | 无监督学习 , 聚类 , 降维 |

我们现在考虑无监督学习，我们只给出输出数据，没有任何输入。目标是在数据中发现“有趣的结构”;这有时被称为知识发现。与监督学习不同，我们没有被告知每个输入所期望输出是什么。相反，我们将我们的任务形式化为密度估计中的一种，也就是说，我们想要构建形如 $p(\boldsymbol{x}_i | \boldsymbol{\theta})$ 的模型。与有监督情形有两点不同。首先，我们写了 $p(\boldsymbol{x}_i | \boldsymbol{\theta})$ 而不是 $p(y_i | \boldsymbol{x}_i,\boldsymbol{\theta})$ ;也就是说，监督学习是条件密度估计，而无监督学习是无条件密度估计。其次， $\boldsymbol{x}_i$ 是特征向量，因此我们需要创建多变量概率模型。相比之下，在监督学习中， $$y_i$$ 通常只是我们试图预测的单个变量。这意味着对于大多数监督学习问题，我们可以使用单变量概率模型（参数依赖的输入），这显着简化了问题。（我们将在第19章讨论多输出分类，我们将在其中看到它还涉及多变量概率模型。）

...