5.4 先验
贝叶斯统计数据中最具争议的方面是它依赖于先验。 贝叶斯认为这是不可避免的,因为没有人是白板(tabula rasa或blank slate):所有的推论都必须以某些关于世界的假设为条件。 然而,人们可能有兴趣尽量减少先验假设的影响。 我们将在下面简要讨论一些方法。
...贝叶斯统计数据中最具争议的方面是它依赖于先验。 贝叶斯认为这是不可避免的,因为没有人是白板(tabula rasa或blank slate):所有的推论都必须以某些关于世界的假设为条件。 然而,人们可能有兴趣尽量减少先验假设的影响。 我们将在下面简要讨论一些方法。
...在图1.18中,我们看到使用过高度数多项式会导致过拟合,而使用过低度数会导致欠拟合。类似地,在图7.8(a)中,我们看到使用太小正则化参数会导致过拟合,而太大值会导致欠拟合。一般来说,当面对一组不同复杂度的模型(即参数分布族)时,我们应该如何选择最好的模型呢?这称为模型选择问题。
...在上一节中,我们讨论了如何推断硬币"正面"出现的概率。在本节中,我们推广这些结果,以推断出有 \(K\) 面的骰子出现第 \(k\) 面的概率。这似乎是另一种玩具练习,但将在后面看到, 我们的研究方法将被广泛用于分析文本数据,生物序列数据等。
...在给定一离散观察序列的情况下, 数字游戏涉及从有限假设空间推断出离散变量的分布, \(h \in \mathcal{H}\) 。这使计算变得特别简单:我们只需要求和,乘和除。然而,在许多应用中,未知参数是连续的,因此假设空间是 \(\mathbb{R}^K\) 的某个子集, 其中 \(K\) 是参数的个数. 这使数学变得复杂,因为我们必须用积分代替和。但是,基本思路是一样的。
...考虑孩子如何学习理解单词的含义,例如“狗”。据推测,孩子的父母指出了这个概念的正面例子,说“看着可爱的小狗!”或“小心小狗”等等。然而,他们提供反面的例子是不太可能的,“看看那只非狗“?。当然,在积极的学习过程中可能会得到负面的例子 - 孩子说“看狗”,父母说“那是猫,亲爱的,不是狗” - 但心理学研究表明,人们可以仅从正面例子来学习概念(Xu和Tenenbaum 2007)。
...