估计器 | 学习笔记

6.4 估计器的理想属性

2019-07-15

| 机器学习 | | 估计器 , 偏差 , 方差 , 均值 , 岭回归 |

返回本章目录

由于频率派决策理论没有提供选择最佳估计器的自动方法，我们需要提出其他启发式方法来选择它们。在本节中，我们将讨论我们所希望估计器应该具有的一些属性。不幸的是，我们将看到我们无法同时实现所有这些属性。

...

6.2 估计器的采样分布

2019-07-13

| 机器学习 | | 估计器 , 采样分布 , 自举 , 大样本 |

返回本章目录

在频率派统计中，通过将估计器 $\delta$ 应用在某些数据 $\mathcal{D}$ 来计算参数估计 $\hat{\boldsymbol{\theta}}$ ，因此 $\hat{\boldsymbol{\theta}}=δ(\mathcal{D})$ 。该参数被视为固定的，并且数据被视为随机的，这与贝叶斯方法完全相反。可以通过计算估计器的采样分布来测量参数估计的不确定性。为了理解这个概念，想象从一些真实模型 $p(·|\boldsymbol{\theta}^*)$ 中采样许多不同的数据集 $\mathcal{D}^{(s)}$ ，即让 $\mathcal{D}^{(s)}= \left\{x_i^{(s)}\right\}_{i=1}^N$ ，其中 $x_i^s \sim p(·|\boldsymbol{\theta}^*)$ ， $\boldsymbol{\theta}^*$ 是真实参数。这里 $$s = 1:S$$ 已采样数据集的索引， $$N$$ 是每个这样的数据集的大小。现在将估计器 $\hat{\theta}(·)$ 应用到每个 $\mathcal{D}^{(s)}$ 以获得一组估计 $\{\hat{\boldsymbol{\theta}}(\mathcal{D}^{(s)})\}$ 。当我们让 $S\to \infty$ 时，在 $\hat{\theta}(·)$ 上诱导的分布就是估计器的采样分布。我们将在后面的章节中讨论使用采样分布的各种方法。但首先我们描绘了两种计算采样分布本身的方法。

...

6.4 估计器的理想属性

2019-07-15

6.3 频率派决策理论

2019-07-14

6.2 估计器的采样分布

2019-07-13