概率论与数理统计期末复习

期末之前临时抱佛脚,复习数理统计

数理统计部分

统计量

  1. 样本平均值 \[\bar{X}=\frac{1}{n}\sum_{i=1}^nX_i\]

  2. 样本方差 \[S^2 = \frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2\]

  3. 样本标准差 \[S = \sqrt{S^2}\]

  4. 样本 k 阶(原点)矩 \[A_k=\frac{1}{n}\sum_{i=1}^nX^k_i,\quad k=1,2,...;\]

  5. 样本 k 阶中心矩 \[B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^k,\quad k=1,2,...;\]

重要定理

Levy-Lindberg 定理 对于已知期望\(E(X_k) = \mu\)、方差\(D(X_k)=\sigma^2\)的独立同分布随机变量,有样本均值

\[\bar{X}\sim N(\mu, \sigma^2/n)\]

Liapunov 中心极限定理 对于已知期望\(E(X_k) = \mu_k\)、方差\(D(X_k)=\sigma^2_k\)的独立非同分布随机变量,有样本之和

\[\sum_{k=1}^nX_k\sim N(\sum_{k=1}^n\mu_k, \sum_{k=1}^n\sigma_k^2)\]

上面两个定理,我们可以将其用于对于之后的样本估计,其核心思想是将未知分布的随机变量的样本当做正态分布来处理。

重要分布

名称 定义 性质 数学期望和方差 对称性
\(\chi^2\)分布 \[\chi^2=\sum_{i=1}^nX_i^2, \quad X_i\sim N(0,1)\] \[\chi^2_1+\chi^2_2\sim\chi^2(n_1+n_2)\] \[E(\chi^2)=n,\quad D(\chi^2)=2n\] 非对称
\(t\)分布 \[t=\frac{X}{\sqrt{Y/n}}, \quad X\sim N(0,1),Y\sim \chi^2(n)\] 上下分位点对称 对称
\(F\)分布 \[F=\frac{U/n_1}{V/n_2}, \quad U\sim\chi^2(n_1),V\sim\chi^2(n_2)\] \[\frac{1}{F}\sim F(n_2,n_1)\] \[F_{1-\alpha}(n_1,n_2) = \frac{1}{F_\alpha(n_2,n_1)}\] 非对称

样本的性质

四大定理

对于来自正态总体的样本\(X_i\),其样本均值、方差分别为\(\bar{X}\)\(S^2\),总体的均值为\(\mu\)\(\sigma^2\)

  1. 样本均值的分布

    \[\bar{X}\sim N(\mu,\sigma^2/n)\]

  2. 样本方差的分布

    1. \(\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)\)
    2. \(\bar{X}\)\(S^2\) 相互独立
  3. 样本均值、标准差组成的分布

    \[\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1)\]

  4. 来自正态的独立样本相关分布

    前置条件,已知有如下的定理成立

    \[\bar{X}-\bar{Y}\sim (\mu_1-\mu_2, \frac{\sigma^2_1}{n_1}+\frac{\sigma^2_2}{n_2})\]

    1. \(\frac{S^2_1/S^2_2}{\sigma^2_1/\sigma^2_2}\sim F(n_1-1,n_2-1)\)

    2. 若有\(\sigma^2_1=\sigma^2_2=\sigma^2\) (整体方差相等)

      \[\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_w\sqrt{1/n_1+1/n_2}}\sim t(n_1+n_2-2)\]

      \[S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}, \quad S_w=\sqrt{S^2_w}\]

参数估计

对于已知分布函数的总体\(X\)的部分参数的估计。

点估计

估计值:使用\(x_1,x_2,x_3,...,x_n\)表示的参数值

估计量:使用\(X_1,X_2,X_3,...,X_n\)表示的参数值

矩估计法 使用样本原点矩对总体参数进行估计,即,使用\(A_i\)来替代\(E(X^i)\),代入等式得到参数的估计值。

极大似然估计法 对于分布律形如\(P\{X=x\}=p(x;\theta)\)的离散型随机变量或者概率密度函数形如\(f(x;\theta)\),令

rWnLFI.png

则有\(\hat{\theta}=argmax L(x_1,x_2,...,x_n,\theta)\)

点估计的无偏性 对于一个参数\(\theta\)的估计量\(\hat{\theta}\),当且仅当\(E(\hat{\theta})=\theta\)时,有\(\hat{\theta}\)\(\theta\)的无偏估计。

区间估计

对于分布函数为\(F(x;\theta)\)的随机变量总体\(X\),若存在

\[P\{\underline{\theta}(X_1,X_2,...,X_n)<\theta<\bar{\theta}(X_1,X_2,...,X_n)\}\ge1-\alpha\]

则称 \(\underline \theta\)\(\bar \theta\)\(\theta\)置信水平\(1-\alpha\)置信下限置信上限

题目做法 首先找到参数的一个无偏估计,然后运用此无偏估计和参数构造枢轴量(不依赖于未知参数的服从已知分布的随机变量),使用该枢轴量得到对应的未知参数的置信区间(参考 P161 例 1)。

单个正态总体的估计

正态总体 \(X\sim N(\mu,\sigma^2)\),置信水平\(1-\alpha\)

\(\mu\)的置信区间

\(\sigma\)已知 置信区间为 \((\bar{X}\pm \frac{\sigma}{\sqrt{n}}z_{\alpha/2})\)\(z_{\alpha/2}\)为标准正态的上\(\alpha/2\)分位点)

\(\sigma\)未知 置信区间为\((\bar X \pm \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1))\)

\(\sigma^2\)的置信区间

\[(\frac{\sqrt{n-1}S}{\sqrt{\chi^2_{\alpha/2}(n-1)}},\frac{\sqrt{n-1}S}{\sqrt{\chi^2_{1-\alpha/2}(n-1)}})\]

两个正态总体

正态总体 \(X_i\sim N(\mu_i,\sigma_i^2)\),置信水平\(1-\alpha\)

\(\mu_1-\mu_2\)的置信区间

\[(\bar{X_1}-\bar{X_2}\pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}})\]

其中\(S_w\)的定义和前文相同。

\(\sigma_1^2/\sigma_2^2\)的置信区间

\[(\frac{S_1^2}{S_2^2}\frac{1}{F_{\alpha/2}(n_1-1,n_2-1)},\frac{S_1^2}{S_2^2}\frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)})\]

假设检验

P189,表 8-1

作者

Hyiker Hu

发布于

2020-12-24

更新于

2021-09-26

许可协议

评论