✍ 写在前面
Coldrain 在第一轮基础复习的时候并没有留下任何笔记,直到概率论刷题的时候,发现知识点比较零散容易忘记,做题卡住了,遂准备从第二轮基础复习开始好好留下笔记,便于知识点检索与记忆
至于为什么选择以 blog 的形式记录,因为 Coldrain 平时没有手写笔记的习惯,而且 blog 形式的笔记可以在任何设备上随时随地打开💦
本笔记内容并没有全覆盖,过于基础的公式与结论未在本笔记中记录,故本笔记可用于一轮学习结束之后对重难考点进行查漏补缺,但请不要用于替代考研书籍来进行一轮复习
“岂不闻天无绝人之路,只要我想走,路就在脚下。”—— 25 奥本海豚
1. 随机事件及其概率
✍ 本部分内容过于简单,所以这里只记录重点公式与结论
-
对立运算
- P(A)=1−P(A)
-
加法运算(并集)
- P(A∪B)=P(A+B)=P(A)+P(B)−P(AB)
- P(A∪B∪C)=P(A+B+C)=P(A)+P(B)+P(C)−P(AB)−P(AC)−P(BC)+P(ABC)
💡 加法运算这里 Coldrain 刻意将 “∪” 与 “+” 都写了上去,因为在有些题目中将“并”运算换成加法运算可以快速化简冗长的随机事件表达式
-
互不相容
-
两事件独立
- P(AB)=P(A)P(B)
💡 两事件独立,进而有:
- P(A∪B)=P(A)+P(B)−P(A)P(B)=1−P(A)P(B)
-
减法运算
- P(A−B)=P(AB)=P(A)−P(AB)
-
乘法运算(交集)
- P(AB)=P(B)P(A∣B)=P(A)P(B∣A)
-
条件概率
- P(B∣A)=P(A)P(AB)
💡 条件概率常用性质
- P(B∣A)+P(B∣A)=1
- P(A1∪A2∣B)=P(A1∣B)+P(A2∣B)−P(A1A2∣B)
- P(A1−A2∣B)=P(A1∣B)−P(A1A2∣B)
- A 与 B 独立时,有 P(AB∣C)=P(A∣C)P(B∣C)
-
全概率公式
- P(B)=i=1∑nP(Ai)P(B∣Ai)
-
贝叶斯公式
- P(Ai∣B)=P(B)P(AiB)=P(B)P(Ai)P(B∣Ai)
⚠️ 本章易错细节
- P(A)=0,不代表 A 为空集!
2. 一维随机变量及其分布
2.1 分布函数
-
分布函数的定义:F(x)=P{X≤x},−∞<x<∞
-
分布函数的性质(一般出选择题)
- (1)单调不减性:F(x) 是单调非减函数
- (2)有界性:0≤F(x)≤1
- (3)右连续性:对任意 x0 有 x→x0+limF(x)=F(x0) 即 F(x0+0)=F(x0)
-
设 F1(x),F2(x) 均是分布函数,则
- (1)当 ai≥0,a1+a2=1 时,a1F1(x)+a2F2(x) 仍为分布函数
- (2)F1(x)F2(x) 仍为分布函数(这也是 X,Y 独立时 max{X,Y} 的分布函数)
- (3)1−[1−F1(x)][1−F2(x)] 仍未分布函数(这也是 X,Y 独立时 min{X,Y} 的分布函数)
-
当 a1≥0,a2≥0 且 a1+a2=1 时,a1f1(x)+a2f2(x) 必为某随机变量的概率密度
✍ 做题小结论:
- 如果 X 的分布函数 F(x) 是连续函数,则有 Y=F(X)~U(0,1)(🇷🇺 套娃,坐标余丙森强化
例 2.14)
- 如果遇到 Y=F(X) 这种分布套分布的问题,可以尝试将 F(X) 图像画出来分类讨论
2.2 常见离散型随机变量及其分布律
-
0-1 分布
- X~B(1,p)
-
二项分布
- X~B(n,p)
- P{X=k}=Cnkpk(1−p)n−k
-
泊松分布
- X~P(λ),其中 λ≥0
- P{X=k}=k!λke−λ
💡 泊松定理(用于近似计算)
设随机变量 X~B(n,p),若 n→+∞limnp=λ
则 n→+∞limCnkpk(1−p)n−k=k!λke−λ=k!(np)ke−(np)
💡 关于泊松分布的公式
回忆一下,在高数里面我们学过一个泰勒展开式:ex=1+x+2!x2+3!x3+...=k=0∑∞k!xk
我们将其中的 x 换成 λ,就有 eλ=k=0∑∞k!λk
那么接下来就有 k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λ⋅eλ=1
诶?!所有离散样本点的概率和为 1,这就是泊松分布的分布律了!
上面泊松分布的来历可以记一下,也许有的题目会出喵 🐱
-
几何分布
- P{X=k}=(1−p)k−1p
- 几何分布具有无记忆性,即 P{X>m+n∣X>m}=P{X>n}
-
超几何分布
- P{X=k}=CNnCMkCN−Mn−k
2.3 常见连续型随机变量及其概率密度
-
均匀分布
- X~U(a,b)
- 概率密度:f(x)=⎩⎨⎧b−a1,0,a<x<botherwise
- 分布函数:F(X)=⎩⎨⎧0,b−ax−a,1,x<aa≤x<bx≥b
-
指数分布
- X~E(λ),其中 λ≥0
- 概率密度:f(x)={λe−λx,0,x>0otherwise
- 分布函数:F(X)={0,1−e−λx,x≤0x>0
- 指数分布也具有无记忆性
-
正态分布
- X~N(μ,σ2)
- 概率密度:f(x)=2πσ1e−2σ2(x−μ)2,−∞<x<+∞
- 分布函数:F(X)=2πσ1∫−∞xe−2σ2(t−μ)2dt
💡 正态分布的性质:
-
当 μ=0,σ2=1 时,X~N(0,1) 称为标准正态分布,密度函数为 φ(x),分布函数为 Φ(x)
-
对任意 X~N(μ,σ2),有 σX−μ~N(0,1)
-
Φ(−a)=1−Φ(a)
-
aX+b~N(aμ+b,a2σ2)
⚠️ 正态分布常考难点
- 做题的时候,给定类似于 f(x)=Aex(B−x) 要能看出来是正态分布
- 计算 E(eX)=∫−∞+∞ex2πσ1e2σ2(x−μ)2,思路是将这个积分里的式子转换成另一个正态分布的的概率密度函数(27 张宇 1000a P70 第 9 题)
3. 二维随机变量及其分布
3.1 二维随机变量及其分布
-
二维随机变量 (X,Y) 落在矩形区域 D={(X,Y)∣x1<X≤x2,y1<Y≤y2} 上的概率为 P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)
-
二维随机变量的边缘分布
- (1)FX(x)=F(X,+∞)=y→+∞limF(X,Y)
- (2)FY(y)=F(+∞,Y)=x→+∞limF(X,Y)
-
卷积公式(应对特殊分布):
- (1)Z=X+Y:fZ(z)=∫−∞+∞f(x,z−x)dx=∫−∞+∞f(z−y,y)dy
- (2)Z=X−Y:fZ(z)=∫−∞+∞f(x,x−z)dx=∫−∞+∞f(z+y,y)dy
💡 当 X 与 Y 相互独立时,有:
- (1)Z=X+Y:fZ(z)=∫−∞+∞fX(x)fY(z−x)dx=∫−∞+∞fX(z−y)fY(y)dy
- (2)Z=X−Y:fZ(z)=∫−∞+∞fX(x)fY(x−z)dx=∫−∞+∞fX(z+y)fY(y)dy
- 二维连续随机变量:F(X,Y)=∫−∞x∫−∞yf(x,y)dxdy
💡 做题的时候经常使用:F(X,Y)=∫−∞x∫−∞yf(u,v)dudv,这样方便区分 x,y
- 二维连续随机变量的边缘概率密度:
- (1)fX(x)∫−∞+∞f(x,y)dy
- (2)fY(y)∫−∞+∞f(x,y)dx
3.2 二维随机变量的独立性
-
二维随机变量独立,则有 F(x,y)=FX(x)FY(y)
-
二维离散型随机变量独立的充要条件:P{X=xi,Y=yj}=P{X=xi}P{Y=yj}
-
二维连续型随机变量独立的充要条件:f(x,y)=fX(x)fY(y)
-
若 X 与 Y 相互独立,则其函数 f(X) 与 g(Y) 也相互独立
-
若 X 与 Y 相互独立,则
- (1)若 X~P(λ1),Y~P(λ2),则 X+Y~P(λ1+λ2)
- (2)若 X~B(m,p),Y~B(n,p),则 X+Y~B(m+n,p)
- (3)若 X~E(λ1),Y~E(λ2),则 min{X,Y}~E(λ1+λ2)
⚠️ 可加性结论考试时最好先证明一遍!
3.3 二维均匀分布
-
定义:设 G 为平面上面积为 A 的有界区域,(X,Y) 服从区域 G 上的均匀分布,则有 f(x,y)=⎩⎨⎧A1,0,(x,y)∈Gotherwise
-
性质:
- (1)若 (X,Y) 服从矩形区域 G={(x,y)∣a<x<b,c<y<d} 上的均匀分布,则 X~U(a,b),Y~U(c,d),且 X 与 Y 相互独立,两个条件分布也是均匀分布
- (2)若 (X,Y) 服从圆形区域 G={(x,y)∣x2+y2≤r2} 上的均匀分布,则两个边缘分布都不是均匀分布,且 X 与 Y 不独立,但其两个条件分布都是均匀分布
3.4 二维正态分布
- 定义:
- (X,Y)~N(μ1,μ2,σ12,σ22,ρ)
- f(x,y)=2πσ1σ21−ρ21exp{−(1−ρ2)1[2σ12(x−μ1)2−ρσ1σ2(x−μ1)(y−μ2)+2σ22(y−μ2)2]]}
💡 公式里的 ρ 是 X 与 Y 的相关系数(Pearson 相关系数),在后面的章节里面会学到,计算方式为:ρ=σ1σ2Cov(X,Y)=σ1σ2E(XY)−E(X)E(Y)
- 性质:
- (1)两个边缘分布都是正态分布,即 X~N(μ1,σ12)、Y~N(μ2,σ22)
- (2)X 与 Y 相互独立 ⇔ρXY=ρ=0⇔X 与 Y 不相关
- (3)X 与 Y 的非零线性组合 (aX+bY,cX+dY) 也遵从二维正态分布
- (4)X 与 Y 的线性组合 aX+bY 仍为正态分布,即 aX+bY~N(aμ1+bμ2,a2σ12+b2σ22+2abρσ1σ2)
- (5)令 {U=a1X+b1YV=a2X+b2Y,当 a1a2b1b2=0 时,(U,V) 服从二维正态分布
3.5 连续型随机变量 (X, Y) 的分布函数 F(x, y)
- 求解方法:设 F(x,y)=∫−∞x∫−∞yf(u,v)dudv,然后分类讨论,画图求解
4. 数字特征
4.1 随机变量的数学期望和方差
-
离散型随机变量的数学期望:E(X)=k=1∑∞xkpk
-
连续型随机变量的数学期望:E(X)=∫−∞+∞xf(x)dx
-
一维随机变量函数的数学期望:
- 设 Y=g(X)
- (1)离散型:E(Y)=E(g(X))=k=1∑∞g(xk)pk
- (2)连续型:E(Y)=E(g(X))=∫−∞+∞g(x)f(x)dx
-
二维随机变量函数的数学期望:
- 设 Z=g(X,Y)
- (1)离散型:E(Z)=E(g(X,Y))=i=1∑+∞j=1∑+∞g(xi,yj)pij
- (2)连续型:E(Z)=E(g(X,Y))=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
-
数学期望的性质:
- (1)E(c)=c
- (2)E(cX)=cE(X)
- (3)E(aX+bY)=aE(X)+bE(Y)
- (4)若 X 与 Y 相互独立,则 E(XY)=E(X)E(Y)
-
方差的计算:D(X)=E[X−E(X)]2=E(X2)−[E(X)]2
-
方差的性质:
- (1)D(c)=0
- (2)D(cX)=c2D(X),D(aX+b)=a2D(X)
- (3)D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
- (4)若 X 与 Y 是相互独立的随机变量 ⇒D(X±Y)=D(X)+D(Y)
- (5)D(X±Y)=D(X)+D(Y)⇔X 与 Y 不相关
- (6)X 与 Y 相互独立,且 E(X)=E(Y)=0⇒D(XY)=D(X)D(Y)
-
常见随机变量分布的数学期望与方差
| 分布名称 | 符号 | 分布列或概率密度 | 数学期望 | 方差 |
|---|
| 0-1 分布 | B(1,p) | P{X=k}=pk(1−p)1−k | p | p(1−p) |
| 二项分布 | B(n,p) | P{X=k}=Cnkpk(1−p)1−k | np | np(1−p) |
| 泊松分布 | P(λ) | P{X=k}=k!λke−λ | λ | λ |
| 几何分布 | G(p) | P{X=k}=(1−p)k−1p | p1 | p21−p |
| 超几何分布 | H(N,M,n) | 待续 | NnM | NnM(1−NM)(N−1N−n) |
| 均匀分布 | U(a,b) | f(x)=b−a1 | 2a+b | 12(b−a)2 |
| 指数分布 | E(λ) | f(x)=λe−λ | λ1 | λ21 |
| 正态分布 | N(μ,σ2) | f(x)=2πσ1e−2σ2(x−μ)2 | μ | σ2 |
| 卡方分布 | χ2(n) | 待续 | n | 2n |
- max{...} 与 min{...}
- (1)U=max{X,Y}=2X+Y+∣X−Y∣
- (2)V=min{X,Y}=2X+Y−∣X−Y∣
- 由上面两个式子,有 U+V=X+Y,U−V=∣X−Y∣、UV=XY
- 进而,E(U+V)=E(X+Y),E(U−V)=E(∣X−Y∣),E(UV)=E(XY)
4.2 协方差与相关系数
-
协方差的计算:Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=E(XY)−E(X)E(Y)
-
协方差的性质
- (1)Cov(X,Y)=Cov(Y,X)
- (2)Cov(X,Y)=D(X)
- (3)Cov(X,c)=0
- (4)Cov(aX,bY)=abCov(X,Y)
- (5)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- (6)如果 X 与 Y 相互独立 ⇒ X 与 Y 不相关 ⇔ Cov(X,Y)=0
-
相关系数 ρXY=D(X)D(Y)Cov(X,Y)
-
相关系数的性质:
- (1)∣ρXY∣=1 的充要条件是:存在常数 a,b(a=0) 使 P{Y=aX+b}=1。且 a>0 时 ρXY=1,a<0 时 ρXY=−1
-
随机变量不相关:ρXY=0(或 Cov(X,Y)=0),则 X 与 Y 不相关
-
不相关与独立
- (1)用韦恩图来表示的话,
独立 是被包含在 不相关 里的,即独立一定不相关,但不相关不代表独立
- (2)当 X 和 Y 的联合分布为二维正态分布时,独立等价于相关
4.3 随机变量的矩
- k 阶原点矩:E(Xk)
- k 阶中心矩:E{[X−E(X)]k}
- k+l 阶混合原点矩:E(XkYl)
- k+l 阶混合中心矩:E{[X−E(X)]k[Y−E(Y)]l}
5. 大数定律和中心极限定理
5.1 大数定律
- 切比雪夫不等式:设随机变量 X 的数学期望 E(X) 和方差 D(X) 均存在,则对任意 ϵ>0,有
- P{∣X−E(X)∣≥ϵ}≤ϵ2D(X)
- 或 P{∣X−E(X)∣<ϵ}>1−ϵ2D(X)
💡 Coldrain 是这样记的:≥ϵ≤
- 切比雪夫大数定律:设随机变量 X1,X2,...,Xn 相互独立,且数学期望和方差都存在,且存在常数 c,使 D(Xi)≤c,i=1,2,...,则对任意正数 ϵ,有
- n→∞limP{∣n1k=1∑nXk−n1k=1∑nE(Xk)∣<ϵ}=1
- 该定理表明:当 n 很大时,n1k=1∑nXk⟶Pn1k=1∑nE(Xk)
下面两个大数定律都是切比雪夫大数定律的特殊形式
- 伯努利大数定律:设 X1,X2,...,Xn 独立且同分布于 0-1 分布 B(1,p),则对任意正数 ϵ,有
- n→∞limP{∣n1i=1∑nXi−p∣<ϵ}=1
💡 伯努利大数定律的等价形式
设 n 次独立重复事件 A 发生的次数为 nA~B(n,p),则对任意正数 ϵ 有:
- n→∞limP{∣nnA−p∣<ϵ}=1
- 辛钦大数定律:设 X1,X2,...,Xn 独立且同分布,且有相同数学期望 E(Xi)=μ,则对任意正数 ϵ,有
- n→∞limP{∣n1i=1∑nXi−μ∣<ϵ}=1
5.2 中心极限定理
-
列维-林德伯格中心极限定理(独立、同分布、相同期望方差):设 X1,X2,...,Xn 独立且同分布,且有相同数学期望 E(Xi)=μ 和方差 D(Xi)=σ2,则对任意实数 x,有
- n→∞limP{σ/nn1∑i=1nXi−μ≤x}=∫−∞x2π1e−2t2dt=Φ(x)
- 定理表明:当 n 充分大时,X=n1i=1∑nXi~近似N(μ,σ2),其标准化 σ/nX−μ 近似服从标准正态分布 N(0,1)
-
棣莫佛-拉普拉斯中心极限定理(二项分布的极限是正态):设随机变量 Yn~B(n,p),则对任意实数 x,有
- n→∞limP{np(1−p)Yn−np≤x}=∫−∞x2π1e−2t2dt=Φ(x)
- 定理表明:当 n 充分大时,Yn~近似N(np,np(1−p)),其标准化随机变量 np(1−p)Yn−np 近似服从标准正态分布 N(0,1),即正态分布是二项分布的极限分布
6. 数理统计的基本概念
6.1 总体与样本
-
总体是指与所研究的问题有关的个体的全体所构成的集合,在数理统计中,总体就是一个服从某概率分布的随机变量 X,其概率分布称为总体分布,其数字特征称为总体数字特征
-
样本的性质:
- 独立性:X1,X2,...,Xn 相互独立
- 代表性:Xi 与 X 同分布
- 无变量重叠的连续函数 U(X1,X2,...,Xk) 和 V(Xk+1,Xk+2,...,Xn) 相互独立
6.2 统计量
-
统计量:样本 X1,X2,...,Xn 的不含总体任何未知参数的函数 g(X1,X2,...,Xn)
-
常见统计量
- (1)样本均值:X=n1i=1∑nXi
- (2)样本方差:S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX)
- (3)样本标准差 S=S2
- (4)样本 k 阶原点矩 Ak=n1i=1∑nXik
- (5)样本 k 阶中心矩 Bk=n1i=1∑n(Xi−X)k
- (6)顺序统计量:X1∗=min{X1,X2,...,Xn},X2∗=max{X1,X2,...,Xn},其分布函数分别为
- Fmin(x)=P{min(X1,X2,...,Xn)≤x}=1−[1−F(x)]n
- Fmax(x)=P{max(X1,X2,...,Xn)≤x}=[F(x)]n
重要结论
- E(X)=E(X)=μ
- D(X)=nD(X)=nσ2
- E(S2)=D(X)=σ2
6.3 卡方分布
-
定义:设(X1,X2,...,Xn)为来自总体 X~N(0,1)的一个简单随机样本,那么统计量 χ2=X12+X22+...+Xn2 为服从自由度为 n 的 χ2 分布,记作 χ2~χ2(n)
-
χ2 分布的性质:
- (1)设 X~N(0,1),则 X2~χ2(1),E(X2)=1,D(X2)=2
- (2)设 χ2~χ2(n),则 E(χ2)=n,D(χ2)=2n
- (3)设 χi2~χ2(ni),且 χ12,χ22 相互独立,则 χ12+χ22~χ2(n1+n2)
6.4 t 分布
-
定义:设 X~N(0,1),Y~χ2(n),且 X 与 Y 相互独立,则称 T=Y/nX 为服从自由度为 n 的 t 分布,记作 T~t(n)
-
性质:
- (1)t 分布概率密度 f(x) 为偶函数,函数图像关于 y 轴对称,则 t1−α(n)=−tα(n)
- (2)当 n→∞ 时,t 分布 T~近似N(0,1)
- (3)T2~F(1,n)
⚠️ 易错题:余丙森强化例 6.5、6.7
6.5 F 分布
-
定义:设 X~χ2(n1),Y~χ2(n2),且 X 与 Y 相互独立,则称 F=Y/n2X/n1 为服从第一自由度为 n1,第二自由度为 n2 的 F 分布,记作 F~F(n1,n2)
-
F 分布的性质
- (1)若 F~F(n1,n2),则 F1~F(n2,n1)
- (2)若 T~t(n),则 T2=Y/nX2~F(1,n)
- (3)F1−α(n1,n2)=Fα(n2,n1)1
6.6 上侧 alpha 分位点
原本是正态分布里面的那个标准正态分布查表法,这里也可以推广到 χ2、t、F 分布中
-
χ2 分布的上侧 α 分位点
- P{χ2>χα2(n)}=∫χα2(n)+∞f(x)dx=α
-
t 分布的上侧 α 分位点
- P{T>tα(n)}=∫tα(n)+∞f(x)dx=α
-
F 分布的上侧 α 分位点
- P{F>Fα(n1,n2)}=∫Fα(n1,n2)+∞f(x)dx=α
6.7 单正态总体下常用统计量的分布
设 X~N(μ,σ2),(X1,X2,...,Xn) 为来自总体 X 的简单随机样本,则
-
关于 X
- (1)X=n1i=1∑nXi~N(μ,nσ2)
- (2)nσX−μ~N(0,1)
- (3)X 与 S2 相互独立,且有 nSX−μ~t(n−1)
-
关于 S2
- (1)X 与 S2 相互独立,且 σ2(n−1)S2=σ2i=1∑n(Xi−X)2~χ2(n−1)
- (2)σ2i=1∑n(Xi−μ)2~χ2(n)(提示:σXi−μ~N(0,1))
⚠️ 东西有点多,但一定要熟练掌握!
6.8 双正态总体
设 X1,X2,...,Xn1 和 Y1,Y2,...,Yn2 分别为来自正态分布 N(μ1,σ12) 和 N(μ2,σ22) 的简单随机样本,且两组样本相互独立,令两个样本的均值和方差分别为
- X=n11i=1∑n1Xi
- S12=n1−11i=1∑n1(Xi−X)2
- Y=n21i=1∑n2Yi
- S22=n2−11i=1∑n2(Yi−Y)2
则有
-
关于均值
- X±Y~N(μ1±μ2,n1σ12+n2σ22)
- n1σ12+n2σ22(X±Y)−(μ1±μ2)~N(0,1)
-
关于方差
- σ12(n1−1)S12+σ22(n2−1)S22~χ2(n1+n2−2)
- σ221i=1∑n2(Yi−μ2)2/n2σ121i=1∑n1(Xi−μ1)2/n1=i=1∑n2(Yi−μ2)2/(n2σ22)i=1∑n1(Xi−μ1)2/(n1σ12)~F(n1,n2)
- S22/σ22S12/σ12~F(n1−1,n2−1)
-
设 σ12=σ22=σ2,则有
- T=SW2n11+n21(X−Y)−(μ1−μ2)~t(n1+n2−2)
- SW2=n1+n2−2(n1−1)S12+(n2−1)S22
💡 这里可以看看 27 余丙森强化例 6.4
7. 参数估计
7.1 参数的点估计、估计量、估计值
- 估计量 θ^(X1,X2,...,Xn) 是一个随机变量
- 估计值 θ^(x1,x2,...,xn) 为估计量所取的具体值
- 点估计 就是用估计量的值估计位置参数的值
7.2 矩估计法
-
用样本矩估计相应的总体矩从而得到参数估计的方法称为矩估计法
-
总体矩:
- μk=E(Xk)
- γk=E{[X−E(X)]k}
小结论:
- μ1=E(X)
- μ2=E(X2)
- γ2=D(X)
- 样本矩:
- Ak=n1i=1∑nXik
- Bk=n1i=1∑n(Xi−X)k
小结论:
- A1=X
- A2=n1i=1∑nXi2
- B2=n1(i=1∑nXi2−nX2)
-
关系:
- E(Ak)=μk
- 由大数定律,Ak⟶Pμk,A1⟶Pμ1、A2⟶Pμ2、Bk⟶PD(X)
-
计算方法:设总体 X 的分布函数为 F(x;θ1,...,θk),其中 θi(i=1,2,...,k) 为待估参数,X1,X2,...,Xn 为总体 X 的一个样本,则求矩估计的步骤为
- (1)求出总体矩(原点矩或中心矩)E(Xi) 或 E[X−E(X)]i
- (2)令总体矩等于相应的样本矩,得方程组,即
- 原点矩 n1j=1∑nXji=E(Xi)
- 或样本矩 n1j=1∑n(Xj−X)i=E[X−E(X)]i
- (3)解上面的方程组,得 θi 的矩估计值为 θ^i(x1,x2,...,xn),θi 的矩估计量为 θ^i(X1,X2,...,Xn)
⚠️ 有 k 个未知参数就求到 k 阶原点矩或中心矩,为方便计算,一般取原点矩
7.3 最大似然估计法
-
似然函数:样本 X1,X2,...,Xn 取到观察值 x1,x2,...,xn 的概率 L(θ)
- (1)离散型:X 分布律为 P{X=xi}=p(xi;θ),则似然函数 L(θ)=P{X1=x1,X2=x2,...,Xn=xn}=i=1∏nP{Xi=xi}=i=1∏np{xi;θ}
- (2)连续型:X 概率密度为 f(x)=f(x;θ),则似然函数 L(θ)=i=1∏nf(xi;θ)
-
思想:在 θ 的取值范围内求 θ^ 使 L(θ^)=maxL(θ)
-
解题步骤:
- (1)写出似然函数 L(θ)=⎩⎨⎧i=1∏np{xi;θ}i=1∏nf(xi;θ)DiscreteContinuous
- (2)求似然函数 L(θ) 的最大值点,若 L(θ) 或 lnL(θ) 可微且易于计算,则可令 dθdL(θ)=0 或 dθdlnL(θ)=0,从而解得 θ(若 X 的分布中包含多个未知量,即 θ=(θ1,θ2,...,θn),则可以分别令偏导数等于 0 解出对应的 θi)
- (3)解出来的 θ 就是最大似然估计值 θ^i(x1,x2,...,xn),最大似然估计量为 θ^i(X1,X2,...,Xn)
💡 若题目给出“样本观察值为 x1、x2、…、xn”(哪怕只有一个样本 x1),那么
- 矩估计中样本均值就是这几个样本的平均值
- 最大似然函数就是把这几个样本观察值代入概率密度函数后相乘
- 最大似然估计的不变性:
- 设 θ^ 是未知参数 θ 的最大似然估计,对于 θ 的函数 g(θ),如果 g(θ) 具有单值反函数,则 g(θ^) 为 g(θ) 的最大似然估计
- 例题可参考 27 张宇 1000a 数理统计第 15 题
⚠️ 若最大似然估计法求解据估计量 θ^ 的过程中,求导之后发现函数为单调递增(或单调递减),那么 θ^ 直接取得边界值,比如边界值为 x≥θ(x≤θ),那么据估计量 θ^ 等于 min{X1,X2,...,Xn}(max{X1,X2,...,Xn})
7.4 估计量的评选标准
- 无偏性:
- 设 θ^ 为 θ 的估计量,若 E(θ^)=θ,则 θ^ 为 θ 的无偏估计量,否则为有偏估计量
- 若 n→0limE(θ^)=θ,则称 θ^ 为 θ 的渐近无偏估计
💡 常用结论:
- (1)X 是 E(X)=μ 的无偏估计,即 E(X)=E(X)=μ
- (2)S2 是 D(X)=σ2 的无偏估计,即 E(S2)=D(X)=σ2
- (3)设 θ1^,θ2^,...,θn^ 均为 θ 的无偏估计,c1,c2,...,cn 为常数且 i=1∑nci=1,则 c1θ1^+c2θ2^+...+cnθn^ 仍是 θ 的无偏估计
💡 最小方差估计量
- 在无偏估计量的前提下,方差最小的估计量称为最小方差估计量(出现在 27 张宇 1000a 数理统计 17 题)
-
有效性:
- 设 θ1^,θ2^ 均为 θ 的无偏估计,若 D(θ1^)<D(θ2^),则称 θ1^ 比 θ2^ 更有效
-
一致性(相合性):
- 若对 ∀ϵ>0,有 n→∞limP{∣θ^−θ∣<ϵ}=1,则称 θ^ 为 θ 的一致估计量或相合估计量
💡 看到一致性,有没有想到切比雪夫不等式?
⚠️ 易错点
- 样本方差 S2 是总体方差 σ2 的无偏估计量
- 但样本标准差 S 不是总体标准差 σ 的无偏估计量!
- 未修正的样本标准差是总体标准差 σ 的最大似然估计量
- 样本标准差 S 不是总体标准差 σ 的最大似然估计
- 样本标准差 S 是总体标准差 σ 的相合估计量
7.5 区间估计
-
置信区间:P{θ1^<θ<θ2^}≥1−α,则称 (θ1^,θ2^) 为未知参数 θ 的置信水平(置信度)为 1−α 的置信区间。
-
单正态总体下参数 μ,σ2 的置信区间(设总体 X~N(μ,σ2),求取置信度为 1−α)
| 题意 | 枢轴量 | 双侧置信区间 | 单侧置信限 |
|---|
| σ2 已知,估 μ | Z=σ/nX−μ∼N(0,1) | (X−nσzα/2,X+nσzα/2) | μ=X+nσzαμ=X−nσzα |
| σ2 未知,估 μ | T=S/nX−μ∼t(n−1) | (X−nStα/2(n−1),X+nStα/2(n−1)) | μ=X+nStα(n−1)μ=X−nStα(n−1) |
| μ 已知,估 σ2 | χ2=σ2i=1∑n(Xi−μ)2∼χ2(n) | χα/22(n)i=1∑n(Xi−μ)2,χ1−α/22(n)i=1∑n(Xi−μ)2 | σ2=χ1−α2(n)i=1∑n(Xi−μ)2σ2=χα2(n)i=1∑n(Xi−μ)2 |
| μ 未知,估 σ2 | χ2=σ2(n−1)S2∼χ2(n−1) | (χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2) | σ2=χ1−α2(n−1)(n−1)S2σ2=χα2(n−1)(n−1)S2 |
- 双正态总体均值和方差的置信水平为 1−α 的区间估计
| 待估参数 | 其他参数 | 双侧置信区间 |
|---|
| μ1−μ2 | σ12,σ22 已知 | (X−Y−uα/2n1σ12+n2σ22,X−Y+uα/2n1σ12+n2σ22) |
| μ1−μ2 | σ12,σ22 未知但 σ12=σ22 | (X−Y−tα/2(n1+n2−2)Swn11+n21,X−Y+tα/2(n1+n2−2)Swn11+n21) |
| σ22σ12 | μ1,μ2 已知 | Fα/2(n1,n2)n11i=1∑n(Xi−μ1)/n21i=1∑n(Yi−μ2),F1−α/2(n1,n2)n11i=1∑n(Xi−μ1)/n21i=1∑n(Yi−μ2) |
| σ22σ12 | μ1,μ2 未知 | (S22S12⋅Fα/2(n1−1,n2−1)1,S22S12⋅F1−α/2(n1−1,n2−1)1) |
- 其中 Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
💡 置信水平的意义:
用同一种抽样方法反复抽样、反复构造置信区间时,其中大约有 1−α 的比例能够包含真实参数
比如:1−α=95
上面这个置信度的含义是:如果我们反复抽样 100 次,并且每次都按同样的方法算一个置信区间,那么大约有 95 个区间会包含真实参数总体,大约 5 个区间不包含真实参数
那么,置信水平越高,区间通常越宽;置信水平越低,区间通常越窄
8. 假设检验
8.1 假设检验的定义与常用概念
-
假设检验的具体做法:
- (1)根据问题的需要对所研究的总体作某种假设,记作 H0
- (2)选取合适的统计量,这个统计量的选取要使得在假设 H0 成立时,其分布为已知
- (3)由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设 H0 的判断
-
备择假设:与原假设 H0 相对的假设 H1
-
检验统计量:用于假设检验问题的统计量称为检验统计量
-
拒绝域与临界点
- 当检验统计量的观测值落在某一个区域时就拒绝 H0,这一区域称为拒绝域
- 拒绝域的边界称为临界点
-
假设检验的两类错误
- (1)第一类错误(弃真错误):原假设 H0 为真时,但检验结果为拒绝原假设 H0
- (2)第二类错误(取伪错误):原假设 H0 不真时,但检验结果为接受原假设 H0
-
犯两类错误的概率
- (1)第一类错误:α=P{拒绝H0∣H0为真}
- (2)第二类错误:α=P{接受H0∣H0为假}
⚠️ 易错点:假设题目告诉你原假设 H0、备择假设 H1,拒绝域 W={X>3},那么
- (1)计算犯第一类错误的概率,即在 H0 成立的前提下,落入拒绝域 W 的概率
- (2)计算犯第二类错误的概率,即在 H1 成立的前提下,落在拒绝域 W 外面(即 X≤3)的概率
- 典型例题:【1000a.30.23】、【1000a.30.24】
8.2 显著性检验
-
显著性检验的定义
- (1)显著性水平:在假设检验中允许犯第一类错误的概率记为 α(0<α<1),则 α 称为显著性水平,它体现了对弃真错误的控制程度
- (2)显著性检验:只控制第一类错误概率 α 的统计检验,称为显著性检验
-
显著性检验的一般步骤(大题套路)
- (1)根据实际问题提出原假设 H0
- (2)如果为单侧检验(≥ 或 ≤),那么可以将原假设 H0 或备择假设 H1 转化到边界处(例如原假设 H0:μ≥10 可以转化为 H0:μ=10)
- (3)选择合适的检验统计量 T 并写出拒绝域 W 的形式
- (3)给出显著性水平 α(0<α<1),并依据第一类错误的概率等于 α 求出拒绝域
- (4)根据题目所给样本值计算检验统计量 T 的观测值,当观测值落在拒绝域内则拒绝原假设 H0,否则接受原假设 H0
⚠️ 题目如果说要检验什么,那么原假设 H0 就应该设为要检验的命题的逆命题
- 显著性水平为 α 的单正态总体均值和方差的假设检验
| H0↔H1 | H0 为真时检验统计量及其分布 | H0 的拒绝域 W |
|---|
| μ=μ0↔μ=μ0 | (σ2 已知) U=σ/nX−μ0~N(0,1) | U≥u2α |
| μ≤μ0↔μ>μ0 | 同上 | U≥uα |
| μ≥μ0↔μ<μ0 | 同上 | U≤−uα |
| μ=μ0↔μ=μ0 | (σ2 未知) T=S/nX−μ0~t(n−1) | T≥t2α(n−1) |
| μ≤μ0↔μ>μ0 | 同上 | T≥tα(n−1) |
| μ≥μ0↔μ<μ0 | 同上 | T≤−tα(n−1) |
| σ2=σ02↔σ2=σ02 | (μ 已知) χ2=σ02i=1∑n(Xi−μ)2~χ2(n) | χ2≥χ2α2(n) 或 χ2≤χ1−2α2(n) |
| σ2≤σ02↔σ2>σ02 | 同上 | χ2≥χα2(n) |
| σ2≥σ02↔σ2<σ02 | 同上 | χ2≤χ1−α2(n) |
| σ2=σ02↔σ2=σ02 | (μ 未知) χ2=σ02(n−1)S2~χ2(n−1) | χ2≥χ2α2(n−1) 或 χ2≤χ1−2α2(n−1) |
| σ2≤σ02↔σ2>σ02 | 同上 | χ2≥χα2(n−1) |
| σ2≥σ02↔σ2<σ02 | 同上 | χ2≤χ1−α2(n−1) |
🐱 有没有感觉拒绝域就是上面 7.5 置信区间取反喵?
- 双正态总体
| H0↔H1 | H0 为真时检验统计量及其分布 | H0 的拒绝域 W |
|---|
| μ1=μ2↔μ1=μ2 | (σ12,σ22 均未知,但 σ12=σ22) T=S/n11+n21X−Y~t(n1+n2−2) | T≥t2α(n1+n2−2) |
| μ1≤μ2↔μ1>μ2 | 同上 | T≥tα(n1+n2−2) |
| μ1≥μ2↔μ1<μ2 | 同上 | T≤−tα(n1+n2−2) |
| σ12=σ22↔σ12=σ22 | (μ1,μ2 未知) F=S22S12~F(n1−1,n2−1) | F≥F2α(n1−1,n2−1) 或 F≤F1−2α(n1−1,n2−1) |
| σ12≤σ22↔σ12>σ22 | 同上 | F≥Fα(n1−1,n2−1) |
| σ12≥σ22↔σ12<σ22 | 同上 | F≤F1−α(n1−1,n2−1) |
- 显著性水平的意义:原假设 H0 成立,经检验 H0 被拒绝的概率(可以理解为犯错的概率)【1000a.30.22】
💡 来看个典型例题


参考文献
[1] 《2026 方浩概率论基础课程讲义》,方浩
[2] 《考研数学概率论与数理统计辅导讲义》2027 版,余丙森,国家开放大学出版社
[3] 《张宇考研数学基础 30 讲》