LOADING

加载过慢请开启缓存 浏览器默认开启

Coldrain 的 27 考研数一概率论笔记

写在前面

Coldrain 在第一轮基础复习的时候并没有留下任何笔记,直到概率论刷题的时候,发现知识点比较零散容易忘记,做题卡住了,遂准备从第二轮基础复习开始好好留下笔记,便于知识点检索与记忆

至于为什么选择以 blog 的形式记录,因为 Coldrain 平时没有手写笔记的习惯💦

本笔记参考书目包括:

  • 27 版的余丙森概率论(基础与强化在同一本书中)
  • 26 版的方皓概率论基础与强化两本书
  • 27 版的张宇概率论基础 9 讲
  • 本科概率论留下的笔记(和社团的朋友们共同编辑的)

1. 随机事件及其概率

2. 一维随机变量及其分布

3. 二维随机变量及其分布

4. 数字特征

5. 大数定律和中心极限定理

6. 数理统计的基本概念

6.1 总体与样本

  1. 总体是指与所研究的问题有关的个体的全体所构成的集合,在数理统计中,总体就是一个服从某概率分布的随机变量 XX,其概率分布称为总体分布,其数字特征称为总体数字特征

  2. 样本的性质:

    • 独立性X1,X2,...,XnX_1, X_2, ..., X_n 相互独立
    • 代表性XiX_iXX 同分布

6.2 统计量

  1. 统计量:样本 X1,X2,...,XnX_1, X_2, ..., X_n不含总体任何未知参数的函数 g(X1,X2,...,Xn)g(X_1, X_2, ..., X_n)

  2. 常见统计量

    • (1)样本均值:X=1ni=1nXi\overline{X} = \dfrac{1}{n} \sum\limits_{i=1}^{n} X_i
    • (2)样本方差:S2=1n1i=1n(XiX)2=1n1(i=1nXi2nX)S^2 = \dfrac{1}{n-1}\sum\limits^{n}_{i=1}(X_i - \overline{X})^2 = \dfrac{1}{n-1} (\sum\limits_{i=1}^{n} X_i^2 - n \overline{X})
    • (3)样本标准差 S=S2S = \sqrt{S^2}
    • (4)样本 kk 阶原点矩 Ak=1ni=1nXikA_k = \dfrac{1}{n} \sum\limits_{i=1}^{n} X_i^k
    • (5)样本 kk 阶中心矩 Bk=1ni=1n(XiX)kB_k = \dfrac{1}{n} \sum\limits_{i=1}^{n} (X_i - \overline{X})^k
    • (6)顺序统计量:X1=min{X1,X2,...,Xn}X_1^* = \min\{X_1, X_2, ..., X_n\}X2=max{X1,X2,...,Xn}X_2^* = \max\{X_1, X_2, ..., X_n\}

重要结论:

  • E(X)=E(X)E(\overline{X}) = E(X)
  • D(X)=D(X)nD(\overline{X}) = \dfrac{D(X)}{n}
  • E(S2)=D(X)E(S^2) = D(X)

6.3 卡方分布

  1. 定义:设(X1,X2,...,Xn)(X_1, X_2, ..., X_n)为来自总体 XN(0,1)X~N(0, 1)的一个简单随机样本,那么统计量 χ2=X12+X22+...+Xn2\chi^2 = X_1^2 + X_2^2 + ... + X_n^2 为服从自由度为 nnχ2\chi^2 分布,记作 χ2χ2(n)\chi^2~\chi^2(n)

  2. χ2\chi^2 分布的性质:

    • (1)设 XN(0,1)X~N(0, 1),则 X2χ2(1)X^2 ~ \chi^2(1)E(X2)=1E(X^2) = 1D(X2)=2D(X^2) = 2
    • (2)设 χ2χ2(n)\chi^2~\chi^2(n),则 E(χ2)=nE(\chi^2) = nD(χ2)=2nD(\chi^2) = 2n
    • (3)设 χi2χ2(ni)\chi_i^2~\chi^2(n_i),且 χ12\chi_1^2χ22\chi_2^2 相互独立,则 χ12+χ22χ2(n1+n2)\chi_1^2 + \chi_2^2 ~ \chi^2(n_1 + n_2)

6.4 t 分布

  1. 定义:设 XN(0,1)X~N(0, 1)Yχ2(n)Y~\chi^2(n),且 XXYY 相互独立,则称 T=XY/nT = \dfrac{X}{\sqrt{Y/n}} 为服从自由度为 nntt 分布,记作 Tt(n)T~t(n)

6.5 F 分布

  1. 定义:设 Xχ2(n1)X~\chi^2(n_1)Yχ2(n2)Y~\chi^2(n_2),且 XXYY 相互独立,则称 F=X/n1Y/n2F = \dfrac{X/n_1}{Y/n_2} 为服从第一自由度为 n1n_1,第二自由度为 n2n_2FF 分布,记作 FF(n1,n2)F~F(n_1, n_2)

  2. F 分布的性质

    • (1)若 FF(n1,n2)F~F(n_1, n_2),则 1FF(n2,n1)\dfrac{1}{F} ~ F(n_2, n_1)
    • (2)若 Tt(n)T~t(n),则 T2=X2Y/nF(1,n)T^2 = \dfrac{X^2}{Y/n} ~ F(1, n)

6.6 上侧 alpha 分位点

原本是正态分布里面的那个标准正态分布查表法,这里也可以推广到 χ2\chi^2ttFF 分布中,此处暂时没什么好写的,可以去看一下参考书上的图

6.7 单正态总体下常用统计量的分布

  1. XN(μ,σ2)X ~ N(\mu, \sigma^2)(X1,X2,...,Xn)(X_1, X_2, ..., X_n) 为来自总体 XX 的简单随机样本,则:
    • (1)X=1ni=1nXiN(μ,σ2n)\overline{X} = \dfrac{1}{n}\sum\limits_{i=1}^{n} X_i ~ N(\mu, \dfrac{\sigma^2}{n})
    • (2)U=Xμσ/nN(0,1)U = \dfrac{\overline{X} - \mu}{\sigma/\sqrt{n}} ~ N(0, 1)
    • (3)X\overline{X}S2S^2 相互独立,且 (n1)S2σ2=i=1n(XiX)2σ2χ2(n1)\dfrac{(n-1)S^2}{\sigma^2} = \dfrac{\sum\limits_{i=1}^{n} (X_i - \overline{X})^2}{\sigma^2} ~ \chi^2(n - 1)
    • (4)i=1n(Xiμ)2σ2χ2(n)\dfrac{\sum\limits_{i=1}^{n} (X_i - \mu)^2}{\sigma^2} ~ \chi^2(n)(提示:XiμσN(0,1)\dfrac{X_i - \mu}{\sigma} ~ N(0, 1)
    • (5)T=XμS/nt(n1)T = \dfrac{\overline{X} - \mu}{S / \sqrt{n}} ~ t(n-1)

6.8 双正态总体

(这个真的会考吗…💦)

7. 参数估计

7.1 参数的点估计、估计量、估计值

  1. 估计量 θ^(X1,X2,...,Xn)\hat{\theta}(X_1, X_2, ..., X_n) 是一个随机变量
  2. 估计值 θ^(x1,x2,...,xn)\hat{\theta}(x_1, x_2, ..., x_n) 为估计量所取的具体值
  3. 点估计 就是用估计量的值估计位置参数的值

7.2 矩估计法

  1. 样本矩估计相应的总体矩从而得到参数估计的方法称为矩估计法

  2. 总体矩:

    • μk=E(Xk)\mu_k = E(X^k)
    • γk=E{[XE(X)]k}\gamma_k = E\{[X - E(X)]^k\}

小结论:

  • μ1=E(X)\mu_1 = E(X)
  • μ2=E(X2)\mu_2 = E(X^2)
  • γ2=D(X)\gamma_2 = D(X)
  1. 样本矩:
    • Ak=1ni=1nXikA_k = \dfrac{1}{n} \sum\limits_{i=1}^{n}X_i^k
    • Bk=1ni=1n(XiX)kB_k = \dfrac{1}{n} \sum\limits_{i=1}^{n} (X_i - \overline{X})^k

小结论:

  • A1=XA_1 = \overline{X}
  • A2=1ni=1nXi2A_2 = \dfrac{1}{n}\sum\limits_{i=1}^{n} X_i^2
  • B2=1n(i=1nXi2nX2)B_2 = \dfrac{1}{n}(\sum\limits_{i=1}^{n}X_i^2 - n\overline{X}^2)
  1. 关系:

    • E(Ak)=μkE(A_k) = \mu_k
    • 由大数定律,AkPμkA_k \overset{P}{\longrightarrow} \mu_kA1Pμ1A_1 \overset{P}{\longrightarrow} \mu_1A2Pμ2A_2 \overset{P}{\longrightarrow} \mu_2BkPD(X)B_k \overset{P}{\longrightarrow} D(X)
  2. 计算方法:按照低阶矩优先原理,建立方程(组),从中解出未知参数

    • (1)当 k=1k=1 时,建立方程:若 E(X)E(X)θ\theta,令 X=E(X)\overline{X} = E(X),解出 θ^\hat{\theta}
    • (2)当 k=2k=2 时,最常用的两个方程为 {X=E(X)1ni=1nXi2=E(X2)\begin{cases} \overline{X} = E(X) \\ \dfrac{1}{n}\sum\limits_{i=1}^{n}X_i^2 = E(X^2) \end{cases}{X=E(X)1n(i=1nXi2nX2)=1ni=1n(XiX)2=D(X)\begin{cases} \overline{X} = E(X) \\ \dfrac{1}{n}(\sum\limits_{i=1}^{n}X_i^2 - n\overline{X}^2) = \dfrac{1}{n} \sum\limits_{i=1}^{n}(X_i - \overline{X})^2 = D(X) \end{cases}

7.3 最大似然估计法

  1. 似然函数:样本 X1,X2,...,XnX_1, X_2, ..., X_n 取到观察值 x1,x2,...,xnx_1, x_2, ..., x_n 的概率 L(θ)L(\theta)

    • (1)离散型XX 分布律为 P{X=x}=p(x;θ)P\{X=x\} = p(x;\theta),则似然函数 L(θ)=P{X1=x1,X2=x2,...,Xn=xn}=i=1nP{Xi=xi}=i=1np{xi;θ}L(\theta) = P\{X_1 = x_1, X_2=x_2, ..., X_n=x_n\} = \prod\limits^{n}_{i=1} P\{X_i=x_i\} = \prod\limits^{n}_{i=1} p\{x_i; \theta\}
    • (2)连续型XX 概率密度为 f(x)=f(x;θ)f(x) = f(x; \theta),则似然函数 L(θ)=i=1nf(xi;θ)L(\theta) = \prod\limits_{i=1}^{n} f(x_i; \theta)
  2. 思想:在 θ\theta 的取值范围内求 θ^\hat{\theta} 使 L(θ^)=maxL(θ)L(\hat{\theta}) = \max L(\theta)

  3. 解题步骤:

    • (1)写出似然函数 L(θ)L(\theta),取对数 lnL(θ)\ln{L(\theta)}
    • (2)对 θ\theta 求导,令导函数为 0,计算得到驻点
    • (3)再针对具体情况分析
  4. 最大似然估计的不变性:

    • θ^\hat{\theta} 是未知参数 θ\theta 的最大似然估计,对于 θ\theta 的函数 g(θ)g(\theta),如果 g(θ)g(\theta) 具有单值反函数,则 g(θ^)g(\hat{\theta})g(θ)g(\theta) 的最大似然估计

7.4 估计量的评选标准

  1. 无偏性:
    • θ^\hat{\theta}θ\theta 的估计量,若 E(θ^)=θE(\hat{\theta}) = \theta,则 θ^\hat{\theta}无偏估计量,否则为有偏估计量
    • limn0E(θ^)=θ\lim\limits_{n \to 0} E(\hat{\theta}) = \theta,则称 θ^\hat{\theta}θ\theta渐近无偏估计

常用结论:

  • (1)X\overline{X}E(X)=μE(X) = \mu 的无偏估计,即 E(X)=E(X)=μE(\overline{X}) = E(X) = \mu
  • (2)S2S^2D(X)=σ2D(X) = \sigma^2 的无偏估计,即 E(S2)=D(X)=σ2E(S^2) = D(X) = \sigma^2
  • (3)设 θ1^,θ2^,...,θn^\hat{\theta_1}, \hat{\theta_2}, ..., \hat{\theta_n} 均为 θ\theta 的无偏估计,c1,c2,...,cnc_1, c_2, ..., c_n 为常数且 i=1nci=1\sum\limits_{i=1}^{n}c_i = 1,则 c1θ1^+c2θ2^+...+cnθn^c_1\hat{\theta_1} + c_2\hat{\theta_2} + ... + c_n\hat{\theta_n} 仍是 θ\theta 的无偏估计
  1. 有效性:

    • θ1^,θ2^\hat{\theta_1}, \hat{\theta_2} 均为 θ\theta 的无偏估计,若 D(θ1^)<D(θ2^)D(\hat{\theta_1}) < D(\hat{\theta_2}),则称 θ1^\hat{\theta_1}θ2^\hat{\theta_2} 更有效
  2. 一致性(相合性):

    • 若对 ϵ>0\forall \epsilon > 0,有 limnP{θ^θ<ϵ}=1\lim\limits_{n\to \infty} P\{|\hat{\theta} - \theta| < \epsilon\} = 1,则称 θ^\hat{\theta}θ\theta 的一致估计量或相合估计量
  3. 置信区间:P{θ1^<θ<θ2^}=1αP\{\hat{\theta_1} < \theta < \hat{\theta_2}\} = 1 - \alpha,则称 (θ1^,θ2^)(\hat{\theta_1}, \hat{\theta_2}) 为未知参数 θ\theta 的置信度为 1α1- \alpha 的置信区间。

  4. 正态总体下参数 μ,σ2\mu, \sigma^2 的置信区间(设总体 XN(μ,σ2)X~N(\mu, \sigma^2),求取置信度为 1α1-\alpha

题意枢轴量双侧置信区间单侧置信限
σ2\sigma^2 已知,估μ\muZ=Xμσ/nN(0,1)Z = \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N\left(0, 1\right)(Xσnzα/2,X+σnzα/2)\left(\overline{X} - \frac{\sigma}{\sqrt{n}}z_{\alpha/2}, \overline{X} + \frac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)μ=X+σnzαμ=Xσnzα\overline{\mu} = \overline{X} + \frac{\sigma}{\sqrt{n}}z_{\green\alpha} \\ \underline{\mu} = \overline{X} - \frac{\sigma}{\sqrt{n}}z_{\green\alpha}
σ2\sigma^2 未知,估μ\muT=XμS/nt(n1)T = \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t\left(\red{n - 1}\right)(XSntα/2(n1),X+Sntα/2(n1))\left(\overline{X} - \frac{S}{\sqrt{n}}t_{\alpha/2}\left(\red{n - 1}\right), \overline{X} + \frac{S}{\sqrt{n}}t_{\alpha/2}\left(\red{n - 1}\right)\right)μ=X+Sntα(n1)μ=XSntα(n1)\overline{\mu} = \overline{X} + \frac{S}{\sqrt{n}}t_{\green\alpha}\left(\red{n - 1}\right) \\ \underline{\mu} = \overline{X} - \frac{S}{\sqrt{n}}t_{\green\alpha}\left(\red{n - 1}\right)
μ\mu 已知,估σ2\sigma^2χ2=i=1n(Xiμ)2σ2χ2(n)\chi^2 = \frac{\sum\limits^n_{i=1}\left(X_i - \mu\right)^2}{\sigma^2} \sim \chi^2\left(n\right)(i=1n(Xiμ)2χα/22(n),i=1n(Xiμ)2χ1α/22(n))\left(\frac{\sum\limits^n_{i=1}\left(X_i - \mu\right)^2}{\chi^2_{\alpha/2}\left(n\right)}, \frac{\sum\limits^n_{i=1}\left(X_i - \mu\right)^2}{\chi^2_{1-\alpha/2}\left(n\right)}\right)σ2=i=1n(Xiμ)2χ1α2(n)σ2=i=1n(Xiμ)2χα2(n)\overline{\sigma^2} = \frac{\sum\limits^n_{i=1}\left(X_i - \mu\right)^2}{\chi^2_{1-\green\alpha}\left(n\right)} \\ \underline{\sigma^2} = \frac{\sum\limits^n_{i=1}\left(X_i - \mu\right)^2}{\chi^2_{\green\alpha}\left(n\right)}
μ\mu 未知,估σ2\sigma^2χ2=(n1)S2σ2χ2(n1)\chi^2 = \frac{\left(n - 1\right) S^2}{\sigma^2} \sim \chi^2\left(n - 1\right)((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))\left(\frac{\left(n - 1\right) S^2}{\chi^2_{\alpha/2}\left(n - 1\right)}, \frac{\left(n - 1\right) S^2}{\chi^2_{1 - \alpha/2}\left(n - 1\right)}\right)σ2=(n1)S2χ1α2(n1)σ2=(n1)S2χα2(n1)\overline{\sigma^2} = \frac{\left(n - 1\right) S^2}{\chi^2_{1 - \green\alpha}\left(n - 1\right)} \\ \underline{\sigma^2} = \frac{\left(n - 1\right) S^2}{\chi^2_{\green\alpha}\left(n - 1\right)}

8. 假设检验