机器学习

5.4 先验

2019-07-07
| 机器学习 | | 先验 | Comment 评论

返回本章目录

贝叶斯统计数据中最具争议的方面是它依赖于先验。 贝叶斯认为这是不可避免的,因为没有人是白板(tabula rasablank slate):所有的推论都必须以某些关于世界的假设为条件。 然而,人们可能有兴趣尽量减少先验假设的影响。 我们将在下面简要讨论一些方法。

...

5.3贝叶斯模型选择

2019-07-06
| 机器学习 | | 模型选择 , 边际拟然 , 奥卡姆剃刀 , 证据 , 先验 , 贝叶斯 , 悖论 | Comment 评论

返回本章目录

在图1.18中,我们看到使用过高度数多项式会导致过拟合,而使用过低度数会导致欠拟合。类似地,在图7.8(a)中,我们看到使用太小正则化参数会导致过拟合,而太大值会导致欠拟合。一般来说,当面对一组不同复杂度的模型(即参数分布族)时,我们应该如何选择最好的模型呢?这称为模型选择问题。

...

5.1 导言

2019-07-04
| 机器学习 | | 贝叶斯 , 统计 | Comment 评论

返回本章目录

我们已经看到了各种不同的概率模型,并且也讨论了如何拟合数据,即我们讨论过使用各种不同的先验来计算MAP参数估计 \(\hat{\boldsymbol{\theta}}={\rm argmax} \ p(\boldsymbol{\theta} | \mathcal{D})\) 。 我们还讨论了对于某些特殊情况如何计算完整的后验 \(p(\boldsymbol{\theta} | \mathcal{D})\) ,以及后验预测密度 \(p(\boldsymbol{x} | \mathcal{D})\) (在后面的章节中,我们将讨论一般情况下的算法)。

...

第五章 贝叶斯统计

2019-07-04
| 机器学习 | Comment 评论

第五章 贝叶斯统计 本节中的目录: 5.1 导言 5.2 后验分布总结 5.3 贝叶斯模型选择 5.4 先验 5.5 分层贝叶斯 5.6 经验贝叶斯 5.7 贝叶斯决策理论 习题

3.5 朴素贝叶斯分类器

2019-07-01
| 机器学习 | | 贝叶斯 , 分类器 , 拟合 , 预测 , 技巧 , 互信息 , 特征选择 | Comment 评论

返回本章目录

在本节中,我们将讨论如何对离散值特征的向量进行分类, \(\boldsymbol{x} \in {1,\dots,K}^D\) ,其中 \(K\) 是每个特征的值域数, \(D\) 是特征的数量。我们将使用生成方法。这要求我们指定类条件分布 \(p(\boldsymbol{x} | y=c)\) 。最简单的方法是假设特征是条件独立的, 对给定类标签。这使我们可以将类条件密度写成一维密度的乘积:

\[ p(\boldsymbol{x} | y=c, \boldsymbol{\theta}) = \prod_{j=1}^D {p(\boldsymbol{x}_j | y=c, \theta_{jc}) } \tag{3.54} \]

此模型被称为 朴素贝叶斯分类器 (NBC)。

...

3.3 贝塔-二项模型

2019-06-29
| 机器学习 | | 拟然 , 先验 , 后验 , 均值 , 众数 , 方差 , 分布 , 拟合 , 悖论 , 预测 | Comment 评论

返回本章目录

在给定一离散观察序列的情况下, 数字游戏涉及从有限假设空间推断出离散变量的分布, \(h \in \mathcal{H}\) 。这使计算变得特别简单:我们只需要求和,乘和除。然而,在许多应用中,未知参数是连续的,因此假设空间是 \(\mathbb{R}^K\) 的某个子集, 其中 \(K\) 是参数的个数. 这使数学变得复杂,因为我们必须用积分代替和。但是,基本思路是一样的。

...