聚类

1.3 无监督学习

2019-06-17
| 机器学习 | | 无监督学习 , 聚类 , 降维 | Comment 评论

返回本章目录

我们现在考虑无监督学习,我们只给出输出数据,没有任何输入。目标是在数据中发现“有趣的结构”;这有时被称为知识发现。与监督学习不同,我们没有被告知每个输入所期望输出是什么。相反,我们将我们的任务形式化为密度估计中的一种,也就是说,我们想要构建形如 \(p(\boldsymbol{x}_i | \boldsymbol{\theta})\) 的模型。与有监督情形有两点不同。首先,我们写了 \(p(\boldsymbol{x}_i | \boldsymbol{\theta})\) 而不是 \(p(y_i | \boldsymbol{x}_i,\boldsymbol{\theta})\) ;也就是说,监督学习是条件密度估计,而无监督学习是无条件密度估计。其次, \(\boldsymbol{x}_i\) 是特征向量,因此我们需要创建多变量概率模型。相比之下,在监督学习中, \(y_i\) 通常只是我们试图预测的单个变量。这意味着对于大多数监督学习问题,我们可以使用单变量概率模型(参数依赖的输入),这显着简化了问题。 (我们将在第19章讨论多输出分类,我们将在其中看到它还涉及多变量概率模型。)

...