大样本 | 学习笔记

大样本

6.2 估计器的采样分布

2019-07-13

| 机器学习 | | 估计器 , 采样分布 , 自举 , 大样本 |

在频率派统计中，通过将估计器 $\delta$ 应用在某些数据 $\mathcal{D}$ 来计算参数估计 $\hat{\boldsymbol{\theta}}$ ，因此 $\hat{\boldsymbol{\theta}}=δ(\mathcal{D})$ 。该参数被视为固定的，并且数据被视为随机的，这与贝叶斯方法完全相反。可以通过计算估计器的采样分布来测量参数估计的不确定性。为了理解这个概念，想象从一些真实模型 $p(·|\boldsymbol{\theta}^*)$ 中采样许多不同的数据集 $\mathcal{D}^{(s)}$ ，即让 $\mathcal{D}^{(s)}= \left\{x_i^{(s)}\right\}_{i=1}^N$ ，其中 $x_i^s \sim p(·|\boldsymbol{\theta}^*)$ ， $\boldsymbol{\theta}^*$ 是真实参数。这里 $$s = 1:S$$ 已采样数据集的索引， $$N$$ 是每个这样的数据集的大小。现在将估计器 $\hat{\theta}(·)$ 应用到每个 $\mathcal{D}^{(s)}$ 以获得一组估计 $\{\hat{\boldsymbol{\theta}}(\mathcal{D}^{(s)})\}$ 。当我们让 $S\to \infty$ 时，在 $\hat{\theta}(·)$ 上诱导的分布就是估计器的采样分布。我们将在后面的章节中讨论使用采样分布的各种方法。但首先我们描绘了两种计算采样分布本身的方法。

...