八参数估计

统计学与概率论的区别就是归纳和演绎，前者通过样本推测总体的分布，而后者已知总体分布去研究样本。因此参数估计则是归纳的过程，参数估计有两种形式：点估计和区间估计（点估计和区间估计都是对于未知参数的估计，而点估计给出的是一个参数可能的值，区间估计给出的是参数可能在的范围）。

8.1 点估计

点估计的概念

参数估计
- 设 $X_{1}, X_{2}, ..., X_{n}$ 是总体 $X$ 的一个样本，其分布函数为 $F (x; θ), θ \in Θ$ ，其中 $θ$ 为未知参数， $Θ$ 为参数空间，若统计量 $g (X_{1}, ..., X_{n})$ 可作为 $θ$ 的一个估计，则称其为 $θ$ 的一个估计量，记为 $\hat{θ}$ ，即 $\hat{θ} = g (X_{1}, ..., X_{n})$
- 注：分布函数 $F (x; θ)$ 也可用分布律（离散型）或密度函数（连续性）代替
点估计
- 若 $x_{1}, x_{2}, ..., x_{n}$ 是样本的一个观测值，则称为 $θ$ 的估计值
- 由于 $g (x_{1}, x_{2}, ..., x_{n})$ 是实数域上的一个点，现用它来估计 $θ$ ，故称这种估计为点估计
- 经典方法
  - 矩估计法
  - 极大似然估计法

点估计的方法

矩估计

用样本矩作为总体同阶矩的估计，即用样本矩的函数去替换相应的总体矩函数

E (\hat{X^{k}}) = \frac{1}{n} i = 1 \sum n X_{i}^{k}

也就是说，先根据具体分布条件，将 $E (X^{k})$ 求出来，是一个关于未知参数 $θ$ 的式子，然后将上式代入，解出 $\hat{θ}$

极大似然估计

思想：一件事情发生或不发生，如果试验一次就发生了，给我们的感觉就是发生的概率比不发生要大。
一般来说，事件 $A$ 发生的概率与参数 $θ \in Θ$ 有关， $θ$ 取值不同， $P (A)$ 也不同，所以应该记事件 $A$ 发生概率为 $P (A ∣ θ)$ ，若 $A$ 发生了，则认为此时的 $θ$ 值应是在 $Θ$ 中使得 $P (A ∣ θ)$ 达到最大的那一个
对离散型随机变量 $P {X = a_{k} ∣ θ} = P_{θ} (a_{k}), k = 1, 2, ...$ ，现有样本观察值 $x_{1}, x_{2}, ..., x_{n}$ ，如何用极大似然估计来估计 $θ$ ？
记 $A = {X_{1} = x_{1}, ..., X_{n} = x_{n}}$ ，则

P (A ∣ θ) = P_{θ} {X_{1} = x_{1}, ..., X_{n} = x_{n}} = i = 1 \prod n P_{θ} (x_{i})

根据极大似然思想， $θ$ 的值应使得样本联合分布律 $\prod_{i = 1}^{n} P_{θ} (x_{i})$ 达到最大。连续型同理。

将样本的联合概率函数看成 $θ$ 的函数，用 $L (θ; x_{1}, ..., x_{n})$ 表示，简记为 $L (θ)$

L (θ) = L (θ; x_{1}, ..., x_{n}) = p (x_{1}; θ) p (x_{2}; θ) ... p (x_{n}; θ)

$L (θ)$ 称为样本的似然函数。若统计量 $\hat{θ} = \hat{θ} (x_{1}, ..., x_{n})$ 满足

L (\hat{θ}) = θ \in Θ max L (θ)

则称 $\hat{θ}$ 是 $θ$ 的最大似然估计，简称MLE（maximum likelihood estimate）.

求极大似然估计的步骤

做似然函数

L (θ) = L (x_{1}, ..., x_{n}; θ) = i = 1 \prod n f (x_{i}; θ)

做对数似然函数

ln L (θ) = ln L (x_{1}, ..., x_{n}; θ) = i = 1 \sum n ln f (x_{i}; θ) ln L (θ) = ln L (x_{1}, ..., x_{n}; θ) = i = 1 \sum n ln f (x_{i}; θ)

列方程：对参数向量求偏导，令其为 0

\frac{d [ ln L ( θ )]}{d θ} = 0

若有解，则解就是 $\hat{θ}_{M L E} (X_{1}, ..., X_{n})$

最小均方误差估计

在样本量一定时，评价一个点估计好坏的度量指标可使用估计值 $\hat{θ}$ 与参数真值 $θ$ 的距离函数，最常用的是距离平方，由于 $\hat{θ}$ 具有随机性，对该函数求期望即得均方误差：

MSE (\hat{θ}) = E (\hat{θ} - θ)^{2} = E [(\hat{θ} - E \hat{θ}) + (E \hat{θ} - θ)]^{2} = E (\hat{θ} - E \hat{θ})^{2} + (E \hat{θ} - θ)^{2} + E (\hat{θ} - E \hat{θ}) = 0 2 E [(\hat{θ} - E \hat{θ}) (E \hat{θ} - θ)] = 点估计的方差 Va r (\hat{θ}) + 偏差的平方 (E \hat{θ} - θ)^{2}

其中，如果 $\hat{θ}$ 是 $θ$ 的无偏估计，则 $MSE (\hat{θ}) = Va r (\hat{θ})$ ，此时用均方误差评价点估计与用方差是完全一样的。如果如果 $\hat{θ}$ 不是 $θ$ 的无偏估计，就要看其均方误差 $MSE (\hat{θ})$ ，即不仅要看其方差大小，还要看其偏差大小。

定义设有样本 $x_{1}, ..., x_{n}$ ，对待估参数 $θ$ ，设有一个估计类，如果对该估计类中另外任意一个 $θ$ 的估计 $θ$ ，在参数空间 $Θ$ 上都有 $MS E_{θ} (\hat{θ}) \leq MS E_{θ} (θ)$ ，称 $\hat{θ} (x_{1}, ..., x_{n})$ 是该估计类中 $θ$ 的一致最小均方误差估计。

最小方差无偏估计

定义设 $\hat{θ}$ 是 $θ$ 的一个无偏估计，如果对另外任意一个 $θ$ 的无偏估计 $θ$ ，在参数空间 $Θ = {θ}$ 上都有 $Va r_{θ} (\hat{θ}) \leq Va r_{θ} (θ)$ ，则称 $\hat{θ}$ 是 $θ$ 的一致最小方差无偏估计，简记为UMVUE。

判断准则设 $\hat{θ} = \hat{θ} (x_{1}, ..., x_{n})$ 是 $θ$ 的一个无偏估计， $Va r (\hat{θ}) < + \infty$ .如果对任意一个满足 $E (φ (x_{1}, ..., x_{n})) = 0$ 的 $φ$ ，都有

C o v_{θ} (\hat{θ}, φ) = 0, \forall θ \in Θ,

则 $\hat{θ}$ 是 $θ$ 的UMVUE.

贝叶斯估计

区别于频率学派，在统计推断中贝叶斯用到了三种信息：总体信息、样本信息和先验信息（频率学派只用了前两种），其中：

总体信息：总体信息即总体分布或总体所属分布族提供的信息，如，若已知总体是正态分布，则可以知道很多信息；
样本信息：样本信息即抽取样本所得观测值提供的信息，如，在有了样本观测值后，可以根据它知道总体的一些特征数；
先验信息：若把抽取样本看作做一次试验，则样本信息就是试验中得到的信息，如，在一次抽样后，这第一次的抽样就是先验信息。先验信息来源于经验和历史资料。

回顾贝叶斯公式：设 ${B_{1}, B_{2}, ... B_{n}}$ 是样本空间的一个分割， $A$ 为 $Ω$ 中的一个事件， $P (B_{i}) > 0$ ， $i = 1, 2, ..., n$ ， $P (A) > 0$ ，则

P (B_{i} ∣ A) = \frac{P ( A ∣ B _{i} ) P ( B _{i} )}{\sum _{j = 1}^{n} P ( A ∣ B _{j} ) P ( B _{j} )}

贝叶斯密度函数形式

在参数 $θ$ 分布已知（已假设）的情况下， $p (x ∣ θ)$ 表示随机变量 $θ$ 取某个给定值时总体的条件概率函数，（参考 $P (A ∣ B)$ ）；
任一未知量 $θ$ 都可以看作随机变量，可用一个概率分布去描述，这个分布成为先验分布，该先验分布 $π (θ)$ ，（参考 $P (B)$ ）；
贝叶斯的观点，样本 $X = (x_{1}, ..., x_{n})$ 的产生需分两步：
从先验分布 $π (θ)$ 产生一个样本 $θ_{0}$ ；
从 $p (X ∣ θ_{0})$ 中产生一组样本。

此时，样本 $X = (x_{1}, ..., x_{n})$ 的联合条件概率函数（参考 $\sum_{j = 1}^{n} P (A ∣ B_{j})$ ）为

p (X ∣ θ_{0}) = p (x_{1}, ..., x_{n} ∣ θ_{0}) = i = 1 \prod n p (x_{i} ∣ θ_{0})

因为 $θ_{0}$ 未知，是从先验分布 $π (θ)$ 中产生的，所以需要考虑它的发生概率，样本 $X$ 和参数 $θ$ 的联合分布（参考 $\sum_{j = 1}^{n} P (A ∣ B_{j}) P (B_{j})$ ）为

h (X, θ) = p (X ∣ θ) π (θ)

因为目的是对 $θ$ 进行推断，所以在有样本观测值 $X = (x_{1}, ..., x_{n})$ 之后，可依据 $h (X, θ)$ 对 $θ$ 作出推断，按照乘法公式（参考1.5.2节）， $h (X, θ)$ 可分解为

h (X, θ) = π (θ ∣ X) m (X)

其中， $m (X)$ 是 $X$ 的边际概率函数，类比 $π (θ)$ ，

m (X) = \int_{Θ} h (X, θ) d θ = \int_{Θ} p (X ∣ θ) π (θ) d θ

所以可通过条件概率 $π (θ ∣ X)$ 推断 $θ$ 的分布

π (θ ∣ X) = \frac{h ( X , θ )}{m ( X )} = \frac{p ( X ∣ θ ) π ( θ )}{\int _{Θ} p ( X ∣ θ ) π ( θ ) d θ}

该分布成为 $θ$ 的后验分布。它其实是利用总体和样本对先验分布 $π (θ)$ 调整的结果，比 $π (θ)$ 更接近 $θ$ 的实际情况（机器学习里的贝叶斯模型就是基于这样的原理）。

8.2 估计量的评选标准

无偏性

设 $\hat{θ} = \hat{θ} (X_{1}, ..., X_{n})$ 为 $θ$ 的估计量，若 $E \hat{θ} = θ$ ，则称 $\hat{θ}$ 为 $θ$ 的无偏估计量

实际意义就是说，用估计量 $\hat{θ}$ 来对未知参数 $θ$ 进行估计，有时会高于 $θ$ ，有时会低于 $θ$ ，但平均下来还是相等的，也就是没有系统误差

一些性质
$X_{1}, X_{2}, ..., X_{n}$ 是来自总体的一个样本，那么 $k$ 阶样本原点矩 $A_{k}$ 是总体样本原点矩 $μ_{k}$ （如果存在的话）的无偏估计，即

E (A_{k}) = E [\frac{1}{n} i = 1 \sum n X_{i}^{k}]

总体 $X$ 的方差 $σ^{2}$ 存在且有限， $X_{1}, X_{2}, ..., X_{n}$ 是来自总体的一个样本，则修正样本方差 $S^{2}$ 是总体方差 $σ^{2}$ 的无偏估计

S^{* 2} E (S^{* 2}) = \frac{1}{n - 1} i = 1 \sum n (X_{i} - \overset{ˉ}{X})^{2} = \frac{1}{n - 1} i = 1 \sum n X_{i}^{2} - \frac{n}{n - 1} (\overset{ˉ}{X})^{2} = \frac{1}{n - 1} i = 1 \sum n E (X_{i}^{2}) - \frac{n}{n - 1} E (\overset{ˉ}{X})^{2} = \frac{1}{n - 1} i = 1 \sum n (σ^{2} + μ^{2}) - \frac{n}{n - 1} (\frac{σ ^{2}}{n} + μ^{2}) = σ^{2}

同时可见，样本中心二阶矩 $S^{* 2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 不是方差 $σ^{2}$ 的无偏估计，

但有 $E (S^{* 2}) = \frac{n - 1}{n} σ^{2} \to σ^{2}$ ，我们称 $S^{* 2}$ 为 $σ^{2}$ 的渐进无偏估计

有效性

设 $\hat{θ}_{i}, i = 1, 2$ 分别是参数 $θ$ 的两个无偏估计即 $E (\hat{θ}_{i}) = θ$ ，若 $D (\hat{θ}_{1}) < D (\hat{θ}_{2})$ ，则称 $\hat{θ}_{1}$ 比 $\hat{θ}_{2}$ 有效，也就是比较 $E (\hat{θ}_{i} - θ)^{2}$ （称为均方误差，记为 $M (\hat{θ}, θ) = E (\hat{θ} - θ)^{2}$ ）

一致性

设 $\hat{θ}_{n} = \hat{θ} (X_{1}, X_{2}, ..., X_{n})$ 是 $θ$ 的估计量，若 $\ce \hat{θ_{n}} - > [p] θ$ ，则称 $\hat{θ}_{n}$ 为 $θ$ 的一致估计量

相合性

根据格里纹科定理，随着样本量不断增大，经验分布函数逼近真实分布函数，即设 $θ \in Θ$ 为未知参数， $\hat{θ}_{n} = \hat{θ}_{n} (x_{1}, ..., x_{n})$ 是 $θ$ 的一个估计量， $n$ 是样本容量，若对任何一个 $ϵ > 0$ ，有

n \to \infty lim P (∣ \hat{θ}_{n} - θ ∣ \geq ϵ) = 0

则称 $\hat{θ}_{n}$ 为参数 $θ$ 的相合估计。

定理1设 $\hat{θ}_{n} = \hat{θ}_{n} (x_{1}, ..., x_{n})$ 是 $θ$ 的一个估计量，若

n \to \infty lim E (\hat{θ}_{n}) = θ, n \to \infty lim Va r (\hat{θ}_{n}) = 0

则 $\hat{θ}_{n}$ 是 $θ$ 的相合估计。

定理2若 $\hat{θ}_{n 1}, ..., \hat{θ}_{nk}$ 分别是 $θ_{1}, ..., θ_{k}$ 的相合估计， $η = g (θ_{1}, ..., θ_{k})$ 是 $θ_{1}, ..., θ_{k}$ 的连续函数，则 $\overset{η}{^}_{n} = g (\hat{θ}_{n 1}, ..., \hat{θ}_{nk})$ 是 $η$ 的相合估计。

矩估计一般都具有相合性：

样本均值是总体均值的相合估计；

样本标准差是总体标准差的相合估计；

样本变异系数 $s / \overset{x}{ˉ}$ 是总体变异系数的相合估计。

渐进正态性（MLE）

在很一般条件下，总体分布 $p (x; θ)$ 中的 $θ$ 的 MLE $\hat{θ}_{n}$ 具有相合性和渐进正态性，即 $\hat{θ}_{n} \sim A N (θ, \frac{1}{n I ( θ )})$ ，其中 $n$ 为样本容量， $I (θ) = \int_{- \infty}^{\infty} (\frac{\partial l n p}{\partial θ})^{2} p (x; θ) d x$ 为费希尔信息量。

充分性（UMVUE）

任一参数 $θ$ 的UMVUE不一定存在，若存在，则它一定是充分统计量的函数；
若 $θ$ 的某个无偏估计 $\hat{θ}$ 不是充分统计量 $T = T (x_{1}, ..., x_{n})$ 的函数，则通过条件期望可以获得一个新的无偏估计 $θ = E (\hat{θ ∣ T})$ ，且方差比原估计的方差要小；
考虑 $θ$ 的估计时，只需要在其充分统计量的函数中寻找即可，该说法对所有统计推断都是正确的，这便是充分性原则。

8.3 区间估计

前面是用一个点来估计未知参数，那么现在尝试构造一个区间 $(\hat{θ}_{1}, \hat{θ}_{2})$ 来估计参数 $θ$ 的范围

区间估计的相关概念

设 $θ$ 是总体 $X$ 的未知参数， $X_{1}, ..., X_{n}$ 是来自总体 $X$ 的样本，若对给定值 $α \in (0, 1)$ ，存在两个统计量 $\hat{θ}_{1} (X_{1}, ..., X_{n}), \hat{θ}_{2} (X_{1}, ..., X_{n})$ ，使得

P (\hat{θ}_{1} < θ < \hat{θ}_{2}) = 1 - α

则称区间 $(\hat{θ}_{1}, \hat{θ}_{2})$ ，是 $θ$ 的置信度为 $1 - α$ 的置信区间， $\hat{θ}_{1}, \hat{θ}_{2}$ 为置信下限和置信上限，而 $α$ 称显著性水平。

区间估计的方法

枢轴量法

Step 1：设法构造一个样本和 $θ$ 的函数 $G = G (x_{1}, ..., x_{n}, θ)$ 使得 $G$ 的分布不依赖于未知参数，称具有这种性质的 $G$ 为枢轴量。

Step 2：适当地选择两个常数c，d，使对给定的 $α (0 < α < 1)$ ，有

P (c \leq G \leq d) = 1 - α

（在离散场合，将上式等号改为 $\geq$ ）

Step 3：假如能将 $c \leq G \leq d$ 进行不等式等价变形化为 $\hat{θ}_{L} \leq θ \leq \hat{θ}_{U}$ ，则有

P_{θ} (\hat{θ}_{L} \leq θ \leq \hat{θ}_{U}) = 1 - α

表明 $[\hat{θ}_{L}, \hat{θ}_{U}]$ 是 $θ$ 的 $1 - α$ 同等置信区间。

Note

注：满足条件的c和d有很多，最终选择的目的是希望平均长度 $E_{θ} (\hat{θ}_{U}) - \hat{θ}_{L}$ 尽可能短，但在一些场合中很难做到这一点，因此可以选择c和d，使得两个尾部概率各为 $α /2$ ，即
$P_{θ} (G < c) = P_{θ} (G > d) = α /2$
得到等尾置信区间。

Example

例：设 $x_{1}, ..., x_{n}$ 是来自均匀总体 $U (0, θ)$ 的一个样本，试对设定的 $α (0 < α < 1)$ 给出 $θ$ 的 $1 - α$ 同等置信区间。

解：三步法：

已知 $θ$ 的最大似然估计为样本的最大次序统计量 $x_{(n)}$ ，而 $x_{(n)} / θ$ 的密度函数为

$p (y; θ) = n y^{n - 1}, 0 < y < 1$
它与参数 $θ$ 无关，故可取 $x_{(n)} / θ$ 作为枢轴量 $G$ 。

由于 $x_{(n)} / θ$ 的分布函数为 $F (y) = y^{n}$ ， $0 < y < 1$ ，故 $P (c \leq x_{(n)} / θ \leq d = d^{n} - c^{n})$ ，因此可以选择适当的c和d满足

$d^{n} - c^{n} = 1 - α$

在 $0 \leq c < d \leq 1$ 及 $d^{n} - c^{n} = 1 - α$ 的条件下，当 $d = 1, c = n α$ 时， $E_{θ} (\hat{θ}_{U}) - \hat{θ}_{L}$ 取最小值，所以 $[x_{(n)}, x_{(n)} / n α]$ 是 $1 - α$ 置信区间

正态总体参数的区间估计

设 $X_{1}, ..., X_{n}$ 独立同分布 $\sim N (μ, σ^{2})$ ，给定 $α$ ，由观测值 $ξ_{1}, \dots, ξ_{n}$ ，求出样本均值 $μ$ 的 $1 - α$ 置信区间

$μ$ 的估计

$σ^{2}$ 已知

由于 $μ$ 的点估计量为 $\overset{ˉ}{X}$ ，且 $\overset{ˉ}{X} ～ N (μ, \frac{δ ^{2}}{n})$ ，构造

U = d e f \frac{X ˉ - μ}{σ / n} ～ N (0, 1)

则对于给定的置信度 $1 - α$ ，由分位点的概念知，存在一个标准正态分布上的 $\frac{α}{2}$ 分位点 $u_{\frac{α}{2}}$ ，使得

P {∣ \frac{X ˉ - μ}{σ / n} ∣ < u_{\frac{α}{2}}} = 1 - α

因为加了绝对值所以是 $u_{\frac{α}{2}}$ ，解得

P {\overset{ˉ}{X} - u_{\frac{α}{2}} \frac{σ}{n} < μ < \overset{ˉ}{X} + u_{\frac{α}{2}} \frac{σ}{n}} = 1 - α

所以 $μ$ 的置信度为 $1 - α$ 的置信区间为

(\overset{ˉ}{X} - u_{\frac{α}{2}} \frac{σ}{n} ， \overset{ˉ}{X} + u_{\frac{α}{2}} \frac{σ}{n})

当然 $μ$ 的置信区间并不唯一

\forall θ, (\overset{ˉ}{X} - u_{θ α} \frac{σ}{n} ， \overset{ˉ}{X} + u_{(1 - θ) α} \frac{σ}{n})

都是 $μ$ 的 $1 - α$ 置信区间，只是 $θ = \frac{1}{2}$ 时区间长度最短

由上述过程可以总结出，求正态总体参数置信区间的解题步骤： - 构造样本的函数，要求仅含待估参数且分布已知——枢轴量 - 令枢轴量落在分位点确定的区间中的概率为给定的置信度（ $1 - α$ ）。要求区间按几何对称或概率对称 - 解不等式得随机的置信区间 - 由观测值及 $α$ 值查表计算得所求置信区间

$σ^{2}$ 未知

由

T = \frac{X ˉ - μ}{S ^{*} / n} ～ t (n - 1)

从而有

P {∣ \frac{X ˉ - μ}{S ^{*} / n} ∣ < t_{\frac{α}{2}} (n - 1)} = 1 - α

解得

P {\overset{ˉ}{X} - t_{\frac{α}{2}} (n - 1) \frac{S ^{*}}{n} \leq μ \leq \overset{ˉ}{X} + t_{\frac{α}{2}} (n - 1) \frac{S ^{*}}{n}} = 1 - α

所以 $μ$ 的置信度为 $1 - α$ 的置信区间为

（ \overset{ˉ}{X} - t_{\frac{α}{2}} (n - 1) \frac{S ^{*}}{n} ， \overset{ˉ}{X} + t_{\frac{α}{2}} (n - 1) \frac{S ^{*}}{n} ）

$σ^{2}$ 的估计

$μ$ 未知

引进

χ^{2} = \frac{( n - 1 ) S ^{* 2}}{σ ^{2}} \sim χ^{2} (n - 1)

对于给定的置信度，可以有这样的构造

P {χ^{2} < χ_{1 - \frac{α}{2}}^{2} (n - 1)} = \frac{α}{2} P {χ^{2} > χ_{\frac{α}{2}}^{2} (n - 1)} = \frac{α}{2}

于是有

P {χ_{1 - \frac{α}{2}}^{2} (n - 1) < \frac{( n - 1 ) S ^{* 2}}{σ ^{2}} < χ_{\frac{α}{2}}^{2} (n - 1)} = 1 - α

从而

P {\frac{( n - 1 ) S ^{* 2}}{χ _{\frac{α}{2}}^{2} ( n - 1 )} < σ^{2} < \frac{( n - 1 ) S ^{* 2}}{χ _{1 - \frac{α}{2}}^{2} ( n - 1 )}} = 1 - α

所以 $σ^{2}$ 的 $1 - α$ 置信区间为

(\frac{( n - 1 ) S ^{* 2}}{χ _{\frac{α}{2}}^{2} ( n - 1 )}, \frac{( n - 1 ) S ^{* 2}}{χ _{1 - \frac{α}{2}}^{2} ( n - 1 )})

$μ$ 已知

引进

χ^{2} = i = 1 \sum n (\frac{ξ _{i} - μ}{σ})^{2} = \frac{1}{σ ^{2}} i = 1 \sum n (ξ_{i} - μ)^{2} - χ^{2} (n)

作为枢轴变量:

P {χ_{1 - \frac{α}{2}}^{2} (n) ⩽ \frac{1}{σ ^{2}} i = 1 \sum n (ξ_{i} - μ)^{2} ⩽ χ_{\frac{α}{2}}^{2} (n) = 1 - α}

区间估计为：

\frac{i = 1 \sum n ( ξ _{i} - μ ) ^{2}}{χ _{\frac{α}{2}}^{2} ( n )}, \frac{i = 1 \sum n ( ξ _{i} - μ ) ^{2}}{χ _{1 - \frac{α}{2}}^{2} ( n )}

两个正态总体均值差的置信区间：

设 $X_{1}, ..., X_{n}$ 独立同分布 $\sim N (μ_{1}, σ_{1}^{2})$ ， $Y_{1}, ..., Y_{n}$ 独立同分布 $\sim N (μ_{2}, σ_{2}^{2})$ ，两样本独立。给定置信度 $1 - α$ ，

求 $μ_{1} - μ_{2}$ 的置信区间

$σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ 未知

T = \frac{X ˉ - Y ˉ - ( μ _{1} - μ _{2} )}{S _{w} 1/ n _{1} + 1/ n _{2}} \sim t (n_{1} - 1 + n_{2} - 1)

那么有

P {∣ T ∣ < t_{\frac{α}{2}} (n_{1} + n_{2} - 2)} = 1 - α

可解得 $μ_{1} - μ_{2}$ 得置信区间

(\overset{ˉ}{X} - \overset{ˉ}{Y} - t_{\frac{α}{2}} (n_{1} + n_{2} - 2) S_{w} 1/ n_{1} + 1/ n_{2}, \overset{ˉ}{X} - \overset{ˉ}{Y} + t_{\frac{α}{2}} (n_{1} + n_{2} - 2) S_{w} 1/ n_{1} + 1/ n_{2}), 其中 S_{w}^{2} = \frac{( n _{1} - 1 ) S _{1}^{* 2} + ( n _{2} - 1 ) S _{2}^{* 2}}{n _{1} + n _{2} - 2}

$σ_{1}, σ_{2}$ 已知

相当于是求 $Z_{i} = X_{i} - Y_{i} \sim N (μ_{1} - μ_{2}, \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}})$ ，类似单个正态总体 $σ^{2}$ 已知时求 $μ$ 的区间估计

求 $\frac{σ _{1}^{2}}{σ _{2}^{2}}$ 的置信区间

$μ_{1}, μ_{2}$ 未知

引进

F = \frac{S _{1}^{* 2} / σ _{1}^{2}}{S _{2}^{* 2} / σ _{2}^{2}} \sim F (n_{1} - 1, n_{2} - 1)

根据 $F$ 分布图像分位点可知

P {F_{1 - \frac{α}{2}} (n_{1} - 1, n_{2} - 1) < F < F_{\frac{α}{2}} (n_{1} - 1, n_{2} - 1)} = 1 - α

可解得 $\frac{σ _{1}^{2}}{σ _{2}^{2}}$ 的置信区间为

(\frac{S _{1}^{* 2} / S _{2}^{* 2}}{F _{\frac{α}{2}} ( n _{1} - 1 , n _{2} - 1 )}, \frac{S _{1}^{* 2} / S _{2}^{* 2}}{F _{1 - \frac{α}{2}} ( n _{1} - 1 , n _{2} - 1 )})

$μ_{1}, μ_{2}$ 已知

引进 $F = \frac{n _{2} σ _{2}^{2}}{n _{1} σ _{1}^{2}} . \frac{\sum _{i = 1}^{n_{1}} ( X _{i} - μ _{1} ) ^{2}}{\sum _{j = 1}^{n_{2}} ( Y _{j} - μ _{2} ) ^{2}} \sim F (n_{1}, n_{2})$

P {F_{1 - \frac{α}{2}} (n_{1}, n_{2}) < F < F_{\frac{α}{2}} (n_{1}, n_{2})} = 1 - α

置信区间为：

[\frac{n _{2}}{n _{1}} . \frac{\sum _{i = 1}^{n_{1}} ( X _{i} - μ _{1} ) ^{2}}{\sum _{j = 1}^{n_{2}} ( Y _{j} - μ _{2} ) ^{2}} \cdot \frac{1}{F _{\frac{α}{2}} ( n _{1} , n _{2} )}, \frac{n _{2}}{n _{1}} . \frac{\sum _{i = 1}^{n_{1}} ( X _{i} - μ _{1} ) ^{2}}{\sum _{j = 1}^{n_{2}} ( Y _{j} - μ _{2} ) ^{2}} \cdot \frac{1}{F _{1 - \frac{α}{2}} ( n _{1} , n _{2} )}]

🪴 Quartz 4.0

Explorer

概率论第八章-参数估计

八 参数估计

8.1 点估计

点估计的概念

点估计的方法

矩估计

极大似然估计

求极大似然估计的步骤

最小均方误差估计

最小方差无偏估计

贝叶斯估计

贝叶斯密度函数形式

8.2 估计量的评选标准

无偏性

有效性

一致性

相合性

渐进正态性（MLE）

充分性（UMVUE）

8.3 区间估计

区间估计的相关概念

区间估计的方法

枢轴量法

正态总体参数的区间估计

μ 的估计

σ2 已知

σ2 未知

σ2 的估计

μ 未知

μ 已知

两个正态总体均值差的置信区间：

求 μ1​−μ2​ 的置信区间

σ12​=σ22​=σ2 未知

σ1​,σ2​ 已知

求 σ22​σ12​​ 的置信区间

μ1​,μ2​ 未知

μ1​,μ2​ 已知

Graph View

Table of Contents

Backlinks

八参数估计

$μ$ 的估计

$σ^{2}$ 已知

$σ^{2}$ 未知

$σ^{2}$ 的估计

$μ$ 未知

$μ$ 已知

求 $μ_{1} - μ_{2}$ 的置信区间

$σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ 未知

$σ_{1}, σ_{2}$ 已知

求 $\frac{σ _{1}^{2}}{σ _{2}^{2}}$ 的置信区间

$μ_{1}, μ_{2}$ 未知

$μ_{1}, μ_{2}$ 已知