特征选择

3.5 朴素贝叶斯分类器

2019-07-01
| 机器学习 | | 贝叶斯 , 分类器 , 拟合 , 预测 , 技巧 , 互信息 , 特征选择 | Comment 评论

返回本章目录

在本节中,我们将讨论如何对离散值特征的向量进行分类, \(\boldsymbol{x} \in {1,\dots,K}^D\) ,其中 \(K\) 是每个特征的值域数, \(D\) 是特征的数量。我们将使用生成方法。这要求我们指定类条件分布 \(p(\boldsymbol{x} | y=c)\) 。最简单的方法是假设特征是条件独立的, 对给定类标签。这使我们可以将类条件密度写成一维密度的乘积:

\[ p(\boldsymbol{x} | y=c, \boldsymbol{\theta}) = \prod_{j=1}^D {p(\boldsymbol{x}_j | y=c, \theta_{jc}) } \tag{3.54} \]

此模型被称为 朴素贝叶斯分类器 (NBC)。

...