10.11Python数学基础-多维随机变量及其分布
多维随机变量及其分布
1.二维随机变量及其分布
假设E是随机试验,Ω是样本空间,X、Y是Ω的两个变量;(X,Y)就叫做二维随机变量或二维随机向量。X、Y来自同一个样本空间。
联合分布函数
F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X≤x,Y≤y) F(x,y)=P(X≤x,Y≤y)
几何意义表示对立体曲线的体积
用平面图形近似表示为:
即F(x,y)表示求(x,y)左下方的面积。
性质:
(1)0≤F(x,y) ≤1
(2)F(x,y) 不减,例如:y固定,x1<x2,F(x1,y)<F(x2,y)
(3)F(-∞,y)=F(x,-∞)=F(-∞,-∞)=0,F(+∞,+∞)=1
(4)F(x,y)分别关于x和y右连续
(5)
对于 x 1 < x 2 , y 1 < y 2 P ( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) 对于x_1<x_2,y_1<y_2\\ P(x_1<X≤x_2,y_1<Y≤y_2) = F(x_2,y_2) - F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1) 对于x1<x2,y1<y2P(x1<X≤x2,y1<Y≤y2)=F(x2,y2)−F(x2,y1)−F(x1,y2)+F(x1,y1)
图形解释:
P ( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) P(x_1<X≤x_2,y_1<Y≤y_2) P(x1<X≤x2,y1<Y≤y2)
表示求以下图形的面积:
等式右边的分布函数用如下图形表示:
F ( x 2 , y 2 ) F(x_2,y_2) F(x2,y2)
表示图中蓝色区域
F ( x 2 , y 1 ) F(x_2,y_1) F(x2,y1)
表示红色区域
F ( x 1 , y 2 ) F(x_1,y_2) F(x1,y2)
表示黄色色区域
所以
F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) F(x_2,y_2) - F(x_2,y_1)-F(x_1,y_2) F(x2,y2)−F(x2,y1)−F(x1,y2)
就是只有蓝色的区域
但是
F ( x 1 , y 1 ) F(x_1,y_1) F(x1,y1)
的区域在减的过程中被减掉了两次,需要补回来一次,所以:
F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) F(x_2,y_2) - F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1) F(x2,y2)−F(x2,y1)−F(x1,y2)+F(x1,y1)
所表示的图形面积才是
P ( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) P(x_1<X≤x_2,y_1<Y≤y_2) P(x1<X≤x2,y1<Y≤y2)
所以:
对于 x 1 < x 2 , y 1 < y 2 P ( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) 对于x_1<x_2,y_1<y_2\\ P(x_1<X≤x_2,y_1<Y≤y_2) = F(x_2,y_2) - F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1) 对于x1<x2,y1<y2P(x1<X≤x2,y1<Y≤y2)=F(x2,y2)−F(x2,y1)−F(x1,y2)+F(x1,y1)
边缘分布
X的边缘分布:
F X ( x ) = P ( X ≤ x ) = F ( x , + ∞ ) = P ( X ≤ x , Y < + ∞ ) F_X(x) = P(X≤x) = F(x,+∞) = P(X≤x,Y<+∞) FX(x)=P(X≤x)=F(x,+∞)=P(X≤x,Y<+∞)
这表示在所有可能的 Y 值上,X 取值 x 的概率总和。从图形曲线上理解就是求小于x的所有点的面积,Y随意取值。
Y的边缘分布:
F Y ( y ) = P ( Y ≤ y ) = F ( + ∞ , y ) = P ( X < + ∞ , Y ≤ y ) F_Y(y) = P(Y≤y) = F(+∞,y) = P(X<+∞,Y≤y) FY(y)=P(Y≤y)=F(+∞,y)=P(X<+∞,Y≤y)
表示在所有可能的 X 值上,Y 取值 y的概率总和。从图形曲线上理解就是求小于y的所有点的面积,X随意取值。
2.二维离散型随机变量的联合分布和边缘分布
联合概率质量函数 P(X=x,Y=y) 描述了随机变量 X 和 Y 同时取特定值 x 和y 的概率。联合PMF满足以下性质:
-
非负性:对于所有的 x 和 y,有 P(X=x,Y=y)≥0。
-
归一性:所有可能的 x 和 y 值的概率之和等于1,即:
∑ x ∑ y P ( X = x , Y = y ) = 1 ∑_x∑_yP(X=x,Y=y)=1 x∑y∑P(X=x,Y=y)=1
概率分布表解释:
假设由一个概率分布表:
X\Y | 1 | 2 | 3 |
---|---|---|---|
1 | 0 | 1/2 | 1/8 |
2 | 1/8 | 1/8 | 1/8 |
非负性表示分布表中的所有概率都要大于等于0。例如:
P ( X = 1 , Y = 2 ) = 1 2 ≥ 0 P ( X = 2 , Y = 2 ) = 1 8 ≥ 0 P(X=1,Y=2)=\dfrac{1}{2}\geq 0\\ P(X=2,Y=2)=\dfrac{1}{8}\geq 0 P(X=1,Y=2)=21≥0P(X=2,Y=2)=81≥0
归一性表示分布表中所有概率之和等于1。
联合分布函数
F ( x , y ) = P ( X ≤ x , Y ≤ y ) = ∑ x i ≤ x ∑ y j ≤ y P ( X = x , Y = y ) F(x,y)=P(X\leq x,Y\leq y)=∑_{x_i\leq x}∑_{y_j\leq y}P(X=x,Y=y) F(x,y)=P(X≤x,Y≤y)=xi≤x∑yj≤y∑P(X=x,Y=y)
概率分布表解释:
F(x,y)的值就是在分布表中找到对应的(x,y)对应的位置,然后将其左上角的概率相加。
例如:
F ( 1 , 2 ) = P ( X ≤ 1 , Y ≤ 2 ) = P ( 1 , 1 ) + P ( 1 , 2 ) = 0 + 1 2 = 1 2 F ( 2 , 2 ) = P ( X ≤ 2 , Y ≤ 2 ) = P ( 1 , 1 ) + P ( 1 , 2 ) + P ( 2 , 1 ) + P ( 2 , 2 ) = 0 + 1 2 + 1 8 + 1 8 = 3 4 F(1,2)=P(X\leq 1,Y\leq 2)=P(1,1)+P(1,2)=0+\dfrac{1}{2}=\dfrac{1}{2}\\ F(2,2)=P(X\leq 2,Y\leq 2)=P(1,1)+P(1,2)+P(2,1)+P(2,2)=0+\dfrac{1}{2}+\dfrac{1}{8}+\dfrac{1}{8}=\dfrac{3}{4} F(1,2)=P(X≤1,Y≤2)=P(1,1)+P(1,2)=0+21=21F(2,2)=P(X≤2,Y≤2)=P(1,1)+P(1,2)+P(2,1)+P(2,2)=0+21+81+81=43
边缘分布
边缘概率质量函数可以通过对联合PMF的适当求和得到。
-
边缘PMF
P X ( x ) P_X(x) PX(x)
:表示随机变量 X 取特定值 x 的概率,不考虑 Y的值。计算方法为:
P X ( x ) = ∑ y P ( X = x , Y = y ) P_X(x)=∑_yP(X=x,Y=y) PX(x)=y∑P(X=x,Y=y)
其中,求和是对所有可能的 y 值进行。 -
边缘PMF
P Y ( y ) P_Y(y) PY(y)
:表示随机变量 Y取特定值 y 的概率,不考虑 X 的值。计算方法为:
P Y ( y ) = ∑ x P ( X = x , Y = y ) P_Y(y)=∑_xP(X=x,Y=y) PY(y)=x∑P(X=x,Y=y)
其中,求和是对所有可能的 x 值进行。
概率分布表解释:
对行求和,得到对X的边缘分布。
对列求和,得到对Y的边缘分布。
例如:
X\Y | 1 | 2 | 3 |
---|---|---|---|
1 | 0 | 1/2 | 1/8 |
2 | 1/8 | 1/8 | 1/8 |
求X的边缘分布:
X | 1 | 2 |
---|---|---|
P | 5/8 | 3/8 |
当X=1时,求该行的概率之和,即:0+1/2+1/8=5/8
以此类推。
求Y的边缘分布:
Y | 1 | 2 | 3 |
---|---|---|---|
P | 1/8 | 5/8 | 1/4 |
当Y=1时,求该列的概率之和,即0+1/8=1/8
以此类推。
3.二维连续随机变量的联合密度和边缘密度函数
对于二维连续随机变量 X 和 Y,其分布函数为:
F ( x , y ) = P ( X ≤ x , Y ≤ y ) = ∫ − ∞ x ∫ − ∞ y f ( s , t ) d s d t F(x,y) = P(X≤x,Y≤y) = ∫_{-∞}^x∫_{-∞}^yf(s,t)dsdt F(x,y)=P(X≤x,Y≤y)=∫−∞x∫−∞yf(s,t)dsdt
则F(x,y)是分布函数,f(x,y)是联合密度函数。
f(x,y)的性质:
-
非负性:对于所有的 x 和 y,有 f(x,y)≥0。
-
归一性:在整个 x 和 y 的取值范围上的积分等于1,即:
∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( x , y ) d x d y = 1 ∫_{-\infty}^{+\infty}∫_{-\infty}^{+\infty}f(x,y) dxdy=1 ∫−∞+∞∫−∞+∞f(x,y) dxdy=1
这个积分是对所有可能的 x 和 y 值进行的。
例子
假设联合密度函数:
f ( x , y ) = { e − ( x + y ) , x > 0 , y > 0 0 , 其它 f(x,y)=\begin{cases} e^{-(x+y)}, & x>0,y>0\\ 0,& 其它 \end{cases} f(x,y)={e−(x+y),0,x>0,y>0其它
求分布函数F(x,y)
解:
根据分布函数可知:
F ( x , y ) = P ( X ≤ x , Y ≤ y ) = ∫ − ∞ x ∫ − ∞ y f ( s , t ) d s d t F(x,y) = P(X≤x,Y≤y) = ∫_{-∞}^x∫_{-∞}^yf(s,t)dsdt F(x,y)=P(X≤x,Y≤y)=∫−∞x∫−∞yf(s,t)dsdt
当x>0且y>0时
∫ − ∞ x ∫ − ∞ y f ( s , t ) d s d t = ∫ 0 x ∫ 0 y e − ( s + t ) d s d t = ∫ 0 x e − s d s ∫ 0 y e − t d t = ( 1 − e − x ) ( 1 − e − y ) ∫_{-∞}^x∫_{-∞}^yf(s,t)dsdt=∫_{0}^x∫_{0}^ye^{-(s+t)}dsdt=∫_{0}^xe^{-s}ds∫_{0}^ye^{-t}dt=(1-e^{-x})(1-e^{-y}) ∫−∞x∫−∞yf(s,t)dsdt=∫0x∫0ye−(s+t)dsdt=∫0xe−sds∫0ye−tdt=(1−e−x)(1−e−y)
当x,y有一个小于0时
F ( x , y ) = P ( X ≤ x , Y ≤ y ) = ∫ − ∞ x ∫ − ∞ y f ( s , t ) d s d t = 0 F(x,y) = P(X≤x,Y≤y) = ∫_{-∞}^x∫_{-∞}^yf(s,t)dsdt=0 F(x,y)=P(X≤x,Y≤y)=∫−∞x∫−∞yf(s,t)dsdt=0
所以
F ( x , y ) = { ( 1 − e − x ) ( 1 − e − y ) , x > 0 , y > 0 0 , 其它 F(x,y)=\begin{cases} (1-e^{-x})(1-e^{-y}), & x>0,y>0\\ 0,& 其它 \end{cases} F(x,y)={(1−e−x)(1−e−y),0,x>0,y>0其它
边缘密度函数
边缘分布函数:
F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( s , t ) d t ] d s F_X(x)=F(x,+\infty)=\int _{-\infty}^x[\int _{-\infty}^{+\infty}f(s,t)dt]ds FX(x)=F(x,+∞)=∫−∞x[∫−∞+∞f(s,t)dt]ds
求导,得出边缘密度函数:
f X ( x ) = ∫ − ∞ + ∞ f ( x , t ) d t = ∫ − ∞ + ∞ f ( x , y ) d y f Y ( y ) = ∫ − ∞ + ∞ f ( s , y ) d s = ∫ − ∞ + ∞ f ( x , y ) d x f_X(x)=\int _{-\infty}^{+\infty}f(x,t)dt=\int _{-\infty}^{+\infty}f(x,y)dy\\ f_Y(y)=\int _{-\infty}^{+\infty}f(s,y)ds=\int _{-\infty}^{+\infty}f(x,y)dx fX(x)=∫−∞+∞f(x,t)dt=∫−∞+∞f(x,y)dyfY(y)=∫−∞+∞f(s,y)ds=∫−∞+∞f(x,y)dx
求X的边缘密度函数就是对y求积分,对Y的边缘密度函数就是对x求积分。
例子
假设联合密度函数:
f ( x , y ) = 1 π 2 ( 1 + x 2 ) ( 1 + y 2 ) f(x,y)=\dfrac{1}{\pi^2(1+x^2)(1+y^2)} f(x,y)=π2(1+x2)(1+y2)1
求边缘密度函数。
解:
对X的边缘密度函数:
f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y = ∫ − ∞ + ∞ 1 π 2 ( 1 + x 2 ) ( 1 + y 2 ) d y = 1 π 2 ( 1 + x 2 ) ∫ − ∞ + ∞ 1 ( 1 + y 2 ) d y = 1 π 2 ( 1 + x 2 ) ∫ − ∞ + ∞ a r c t a n ( y ) ∣ − ∞ + ∞ = 1 π ( 1 + x 2 ) f_X(x)=\int _{-\infty}^{+\infty}f(x,y)dy=\int _{-\infty}^{+\infty}\dfrac{1}{\pi^2(1+x^2)(1+y^2)}dy\\ =\dfrac{1}{\pi^2(1+x^2)}\int _{-\infty}^{+\infty}\dfrac{1}{(1+y^2)}dy=\dfrac{1}{\pi^2(1+x^2)}\int _{-\infty}^{+\infty}arctan(y)|_{-\infty}^{+\infty}=\dfrac{1}{\pi(1+x^2)} fX(x)=∫−∞+∞f(x,y)dy=∫−∞+∞π2(1+x2)(1+y2)1dy=π2(1+x2)1∫−∞+∞(1+y2)1dy=π2(1+x2)1∫−∞+∞arctan(y)∣−∞+∞=π(1+x2)1
对Y的边缘密度函数:
f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d y = 1 π ( 1 + y 2 ) f_Y(y)=\int _{-\infty}^{+\infty}f(x,y)dy=\dfrac{1}{\pi(1+y^2)} fY(y)=∫−∞+∞f(x,y)dy=π(1+y2)1
4.条件分布
条件分布是指在已知另一个随机变量或事件的条件下,该随机变量的概率分布。
F ( x ∣ A ) = P ( X ≤ x ∣ A ) F(x|A)=P(X\leq x | A) F(x∣A)=P(X≤x∣A)
例子
假设概率密度函数
f ( x ) = 1 π ( 1 + x 2 ) f(x)=\dfrac{1}{\pi(1+x^2)} f(x)=π(1+x2)1
求在X>1的条件下f(x)的条件分布函数
解:
F ( x ∣ X > 1 ) = P ( X ≤ x ∣ X > 1 ) F(x|X>1)=P(X\leq x|X>1) F(x∣X>1)=P(X≤x∣X>1)
当x≤1时:
不满足条件
F ( x ∣ X > 1 ) = 0 F(x|X>1)=0 F(x∣X>1)=0
当x>1时:
F ( x ∣ X > 1 ) = P ( X ≤ x ∣ X > 1 ) = P ( X ≤ x , X > 1 ) P ( X > 1 ) F(x|X>1)=P(X\leq x|X>1)=\dfrac{P(X\leq x,X>1)}{P(X>1)} F(x∣X>1)=P(X≤x∣X>1)=P(X>1)P(X≤x,X>1)
计算分子:
P ( X ≤ x , X > 1 ) = P ( 1 ≤ X ≤ x ) = ∫ 1 x 1 π ( 1 + x 2 ) d x = 1 π a r c t a n ( x ) ∣ 1 x = a r c t a n x π − 1 π . π 4 = a r c t a n x π − 1 4 P(X\leq x,X>1)=P(1\leq X\leq x)=\int _1^x\dfrac{1}{\pi(1+x^2)}dx=\dfrac{1}{\pi}arctan(x)|_1^x=\dfrac{arctanx}{\pi}-\dfrac{1}{\pi}.\dfrac{\pi}{4}=\dfrac{arctanx}{\pi}-\dfrac{1}{4} P(X≤x,X>1)=P(1≤X≤x)=∫1xπ(1+x2)1dx=π1arctan(x)∣1x=πarctanx−π1.4π=πarctanx−41
计算分母:
P ( X > 1 ) = ∫ 1 + ∞ 1 π ( 1 + x 2 ) d x = 1 π a r c t a n ( x ) ∣ 1 + ∞ = 1 π . ( π 2 − π 4 ) = 1 4 P(X>1)=\int _1^{+\infty}\dfrac{1}{\pi(1+x^2)}dx=\dfrac{1}{\pi}arctan(x)|_1^{+\infty}=\dfrac{1}{\pi}.(\dfrac{\pi}{2}-\dfrac{\pi}{4})=\dfrac{1}{4} P(X>1)=∫1+∞π(1+x2)1dx=π1arctan(x)∣1+∞=π1.(2π−4π)=41
则
F ( x ∣ X > 1 ) = P ( X ≤ x , X > 1 ) P ( X > 1 ) = 4 a r c t a n x π − 1 F(x|X>1)=\dfrac{P(X\leq x,X>1)}{P(X>1)}=\dfrac{4arctanx}{\pi}-1 F(x∣X>1)=P(X>1)P(X≤x,X>1)=π4arctanx−1
所以在X>1的条件下f(x)的条件分布函数
F ( x ∣ X > 1 ) = { 4 a r c t a n x π − 1 , x > 1 0 , x ≤ 1 F(x|X>1)=\begin{cases} \dfrac{4arctanx}{\pi}-1, & x>1\\ 0,& x≤1 \end{cases} F(x∣X>1)=⎩ ⎨ ⎧π4arctanx−1,0,x>1x≤1
5.离散型随机变量的条件分布
条件概率质量函数定义为:
P ( X = x ∣ Y = y ) = P ( X = x , Y = y ) P ( Y = y ) P(X=x∣Y=y)=\dfrac{P(X=x,Y=y)}{P(Y=y)} P(X=x∣Y=y)=P(Y=y)P(X=x,Y=y)
其中 P(X=x,Y=y)是 X 和 Y的联合概率质量函数,P(Y=y) 是 Y 的边缘概率质量函数。
从分布表来理解:
假设概率分布表:
X\Y | 0 | 1 |
---|---|---|
0 | 0.1 | 0.3 |
1 | 0.3 | 0.3 |
P(Y=y) 是 Y 的边缘概率质量函数,Y 的边缘概率质量函数是对列求和:
Y | 0 | 1 |
---|---|---|
P | 0.4 | 0.6 |
那么在Y=1的条件下,假设x=0,X=x的概率为:
P ( X = 0 ∣ Y = 1 ) = P ( X = 0 , Y = 1 ) P ( Y = 1 ) = 0.3 0.6 = 0.5 P(X=0∣Y=1)=\dfrac{P(X=0,Y=1)}{P(Y=1)}=\dfrac{0.3}{0.6}=0.5 P(X=0∣Y=1)=P(Y=1)P(X=0,Y=1)=0.60.3=0.5
假设x=1,X=x的概率为:
P ( X = 1 ∣ Y = 1 ) = P ( X = 1 , Y = 1 ) P ( Y = 1 ) = 0.3 0.6 = 0.5 P(X=1∣Y=1)=\dfrac{P(X=1,Y=1)}{P(Y=1)}=\dfrac{0.3}{0.6}=0.5 P(X=1∣Y=1)=P(Y=1)P(X=1,Y=1)=0.60.3=0.5
则在Y=1的条件下,X的分布函数为:
X | 0 | 1 |
---|---|---|
P(X|Y=1) | 0.3 | 0.3 |
其它情况如Y=0条件下X的分布函数、X=0及X=1条件下Y的分布函数同上。
6.连续型随机变量的条件分布
在Y=y条件下,条件概率密度函数为:
f ( x ∣ y ) = f ( x , y ) f Y ( y ) f(x∣y)=\dfrac{f(x,y)}{f_Y(y)} f(x∣y)=fY(y)f(x,y)
其中 f(x,y) 是 X 和 Y 的联合概率密度函数,
f Y ( y ) f_Y(y) fY(y)
是 Y的边缘概率密度函数。
同理,在X=x条件下,条件概率密度函数为:
f ( y ∣ x ) = f ( x , y ) f X ( x ) f(y∣x)=\dfrac{f(x,y)}{f_X(x)} f(y∣x)=fX(x)f(x,y)
其中 f(x,y) 是 X 和 Y 的联合概率密度函数,
f X ( x ) f_X(x) fX(x)
是 X的边缘概率密度函数。
在Y=y的条件下,X的条件分布函数:
F ( x ∣ y ) = ∫ − ∞ x f ( x ∣ y ) d x = ∫ − ∞ x f ( u , y ) f Y ( y ) d u F(x|y)=\int _{-\infty}^xf(x∣y)dx=\int _{-\infty}^x\dfrac{f(u,y)}{f_Y(y)}du F(x∣y)=∫−∞xf(x∣y)dx=∫−∞xfY(y)f(u,y)du
在X=x的条件下,Y的条件分布函数:
F ( y ∣ x ) = ∫ − ∞ y f ( y ∣ x ) d y = ∫ − ∞ y f ( x , v ) f X ( x ) d v F(y|x)=\int _{-\infty}^yf(y∣x)dy=\int _{-\infty}^y\dfrac{f(x,v)}{f_X(x)}dv F(y∣x)=∫−∞yf(y∣x)dy=∫−∞yfX(x)f(x,v)dv
例子
假设
f ( x , y ) = 1 π 2 ( 1 + x 2 ) ( 1 + y 2 ) , f X ( x ) = 1 π ( 1 + x 2 ) , f Y ( y ) = 1 π ( 1 + y 2 ) f(x,y)=\dfrac{1}{\pi^2(1+x^2)(1+y^2)},f_X(x)=\dfrac{1}{\pi(1+x^2)},f_Y(y)=\dfrac{1}{\pi(1+y^2)} f(x,y)=π2(1+x2)(1+y2)1,fX(x)=π(1+x2)1,fY(y)=π(1+y2)1
求
在Y=y的条件下,X的条件密度函数;在X=x的条件下,Y的条件密度函数。
解:
f ( x ∣ y ) = f ( x , y ) f Y ( y ) = π ( 1 + y 2 ) π 2 ( 1 + x 2 ) ( 1 + y 2 ) = 1 π ( 1 + x 2 ) f ( y ∣ x ) = f ( x , y ) f X ( x ) = π ( 1 + x 2 ) π 2 ( 1 + x 2 ) ( 1 + y 2 ) = 1 π ( 1 + y 2 ) f(x|y)=\dfrac{f(x,y)}{f_Y(y)}=\dfrac{\pi(1+y^2)}{\pi^2(1+x^2)(1+y^2)}=\dfrac{1}{\pi(1+x^2)}\\ f(y|x)=\dfrac{f(x,y)}{f_X(x)}=\dfrac{\pi(1+x^2)}{\pi^2(1+x^2)(1+y^2)}=\dfrac{1}{\pi(1+y^2)} f(x∣y)=fY(y)f(x,y)=π2(1+x2)(1+y2)π(1+y2)=π(1+x2)1f(y∣x)=fX(x)f(x,y)=π2(1+x2)(1+y2)π(1+x2)=π(1+y2)1
7.随机变量的独立性
定义
两个随机变量 XX 和 YY 被称为独立的,如果它们满足以下条件:
对于连续型随机变量:它们的联合概率密度函数f(x,y)可以表示为各自边缘概率密度函数的乘积:
f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y)=f_X(x)⋅f_Y(y) f(x,y)=fX(x)⋅fY(y)
对于离散型随机变量:它们的联合概率质量函数P(X=x,Y=y)可以表示为各自边缘概率质量函数的乘积:
P ( X = x , Y = y ) = P ( X = x ) ⋅ P ( Y = y ) P(X=x,Y=y)=P(X=x)⋅P(Y=y) P(X=x,Y=y)=P(X=x)⋅P(Y=y)
例子
1.假设我们有两个公平的六面骰子,我们分别将它们记为骰子A和骰子B。
随机变量定义为:
让 X 表示骰子A的结果。
让 Y 表示骰子B的结果。
事件:
事件 A:“骰子A显示的数字大于3”。
事件 B:“骰子B显示的数字是偶数”。
问事件A和B是否独立。
解:
联合概率分布表:
X\Y | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
1 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 |
2 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 |
3 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 |
4 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 |
5 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 |
6 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 | 1\36 |
X的边缘概率分布表:
X | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
P | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
Y的边缘概率分布表:
Y | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
P | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
事件A的概率:
P ( A ) = P ( X > 3 ) = P ( X = 4 ) + P ( X = 5 ) + P ( X = 6 ) = 1 / 2 P(A)=P(X>3)=P(X=4)+P(X=5)+P(X=6)=1/2 P(A)=P(X>3)=P(X=4)+P(X=5)+P(X=6)=1/2
事件B的概率:
P ( B ) = P ( Y = 2 ) + P ( Y = 4 ) + P ( Y = 6 ) = 1 / 2 P(B)=P(Y=2)+P(Y=4)+P(Y=6)=1/2 P(B)=P(Y=2)+P(Y=4)+P(Y=6)=1/2
事件A和B的联合概率:
P ( A B ) = P ( X = 4 , Y = 2 ) + P ( X = 4 , Y = 4 ) + P ( X = 4 , Y = 6 ) + P ( X = 5 , Y = 2 ) + P ( X = 5 , Y = 4 ) + P ( X = 5 , Y = 6 ) + P ( X = 6 , Y = 2 ) + P ( X = 6 , Y = 4 ) + P ( X = 6 , Y = 6 ) = 1 / 4 P(AB)=P(X=4,Y=2)+P(X=4,Y=4)+P(X=4,Y=6)\\ +P(X=5,Y=2)+P(X=5,Y=4)+P(X=5,Y=6)\\ +P(X=6,Y=2)+P(X=6,Y=4)+P(X=6,Y=6)=1/4 P(AB)=P(X=4,Y=2)+P(X=4,Y=4)+P(X=4,Y=6)+P(X=5,Y=2)+P(X=5,Y=4)+P(X=5,Y=6)+P(X=6,Y=2)+P(X=6,Y=4)+P(X=6,Y=6)=1/4
所以
P ( A B ) = P ( A ) P ( B ) = 1 / 4 P(AB)=P(A)P(B)=1/4 P(AB)=P(A)P(B)=1/4
所以A、B事件是独立的。
2.假设经理8-12点到公司,秘书7-9点到公司,经理和秘书到公司的事件是独立的,求经理和秘书到公司的联合概率。
解:
设X是经理到公司的事件,Y为秘书到公司的事件,则:X、Y的密度函数服从均匀分布。
f ( x ) = { 1 4 , 8 < x < 12 0 , 其它 f(x)=\begin{cases} \dfrac{1}{4},& 8<x<12\\ 0, & 其它 \end{cases} f(x)=⎩ ⎨ ⎧41,0,8<x<12其它
f ( y ) = { 1 2 , 7 < y < 9 0 , 其它 f(y)=\begin{cases} \dfrac{1}{2},& 7<y<9\\ 0, & 其它 \end{cases} f(y)=⎩ ⎨ ⎧21,0,7<y<9其它
由于X、Y是独立的,则联合密度函数:
f ( x , y ) = f ( x ) f ( y ) = { 1 8 , 8 < x < 12 , 7 < y < 9 0 , 其它 f(x,y)=f(x)f(y)=\begin{cases} \dfrac{1}{8},& 8<x<12,7<y<9\\ 0, & 其它 \end{cases} f(x,y)=f(x)f(y)=⎩ ⎨ ⎧81,0,8<x<12,7<y<9其它
8.二维随机变量函数的分布
8.1 二维离散型随机变量函数的分布
二维离散型随机变量函数的分布指的是在给定两个离散型随机变量 X 和 Y的情况下,它们函数 Z=g(X,Y)的分布。这里
g(X,Y)是一个定义在 X和 Y取值范围内的函数。
要找到函数 Z 的分布,我们需要确定 Z 的每一个可能值的概率。具体步骤如下:
- 确定函数的输出值:列出函数 Z=g(X,Y)可能的所有输出值。
- 计算每个输出值的概率:对于每一个可能的输出值 z,计算 Z=z的概率。这通常涉及到对 X 和 Y的联合概率质量函数 P(X=x,Y=y)进行求和。
- 构建概率质量函数:构建函数 Z 的概率质量函数,即对于每一个可能的 z,确定 P(Z=z)。
例子
假设有两个离散型随机变量 XX 和 YY,它们的联合PMF如下表所示:
X \ Y | 1 | 2 | 3 |
---|---|---|---|
1 | 0.1 | 0.2 | 0.0 |
2 | 0.0 | 0.3 | 0.0 |
3 | 0.1 | 0.1 | 0.2 |
求函数 Z=X+Y。
解:
-
确定函数的输出值:列出所有可能的 X 和 Y组合的和。
1+1=2
1+2=3
1+3=4
2+2=4
2+3=5
3+3=6
所以,Z 可能的值是 2, 3, 4, 5, 6。
-
计算每个输出值的概率:
P(Z=2)=P(X=1,Y=1)=0.1
P(Z=3)=P(X=1,Y=2)+P(X=2,Y=1)=0.2
P(Z=4)=P(X=1,Y=3)+P(X=2,Y=2)+P(X=3,Y=1)=0.0+0.3+0.1=0.4
P(Z=5)=P(X=2,Y=3)+P(X=3,Y=2)=0.1
P(Z=6)=P(X=3,Y=3)=0.2
-
构建概率质量函数:
P(Z=2)=0.1
P(Z=3)=0.2
P(Z=4)=0.4
P(Z=5)=0.1
P(Z=6)=0.2
-
函数分布表为:
Z 2 3 4 5 6 P 0.1 0.2 0.4 0.1 0.2
以上的解法比较麻烦,可以根据分布表来计算。
1.根据Z=X+Y,将X的每行分别于Y的每列分别相加,得到Z的取值,再按X、Y在表格中对应的单元格中的值照抄过来,得到:
Z | 2 | 3 | 4 | 3 | 4 | 5 | 4 | 5 | 6 |
---|---|---|---|---|---|---|---|---|---|
P | 0.1 | 0.2 | 0.0 | 0.0 | 0.3 | 0.0 | 0.1 | 0.1 | 0.2 |
2.合并Z中重复的值及对应的概率,即概率相加:
Z | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|
P | 0.1 | 0.2 | 0.4 | 0.1 | 0.2 |
8.2 二维连续型随机变量函数的分布
二维连续型随机变量函数的分布是指由两个连续型随机变量 (X,Y)构成的联合分布,并通过某种函数关系 Z=g(X,Y)得到一个新的随机变量 Z
的分布。
假设 (X,Y)是一个二维连续型随机变量,其联合概率密度函数为 f(x,y)。设 Z=g(X,Y) 是一个函数关系,其中 g 是一个已知的函数。我们需要
找到 Z 的概率密度函数
f Z ( z ) f_Z(z) fZ(z)
具体步骤如下:
-
计算 Z的累积分布函数
F Z ( z ) F_Z(z) FZ(z)
:
F Z ( z ) = P ( Z ≤ z ) = P ( g ( X , Y ) ≤ z ) F_Z(z)=P(Z≤z)=P(g(X,Y)≤z) FZ(z)=P(Z≤z)=P(g(X,Y)≤z)这可以通过对联合分布函数进行积分得到:
F Z ( z ) = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y F_Z(z)=∬_{g(x,y)≤z}f(x,y) dx dy FZ(z)=∬g(x,y)≤zf(x,y) dx dy -
求导得到概率密度函数
f Z ( z ) f_Z(z) fZ(z)
:
f Z ( z ) = d d z F Z ( z ) f_Z(z)=\dfrac{d}{dz}F_Z(z) fZ(z)=dzdFZ(z)
对于某些特定的函数 g(X,Y),可以直接求出 Z 的概率密度函数。例如,如果 g(X,Y)=X+Y,则可以通过以下步骤求出 Z 的概率密度函数:
-
确定 Z 的范围:
Z=X+Y
确定 Z 的可能取值范围。 -
计算 Z的概率密度函数:
f Z ( z ) = ∫ − ∞ ∞ f X ( x ) f Y ( z − x ) d x f_Z(z)=∫_{−∞}^∞f_X(x)f_Y(z−x)dx fZ(z)=∫−∞∞fX(x)fY(z−x)dx这称为卷积公式。
例子
假设 (X,Y) 的联合概率密度函数为:
f ( x , y ) = { 2 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 0 , otherwise f(x, y) = \begin{cases} 2, & 0 \leq x \leq 1, 0 \leq y \leq 1 \\ 0, & \text{otherwise} \end{cases} f(x,y)={2,0,0≤x≤1,0≤y≤1otherwise
求Z*=*X+Y的分布
解:
确定Z的范围:
0 ≤ Z ≤ 2 0\leq Z \leq 2 0≤Z≤2
先求分布函数:
F Z ( z ) = P ( Z ≤ z ) = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y F_Z(z)=P(Z≤z)=∬_{g(x,y)≤z}f(x,y) dx dy FZ(z)=P(Z≤z)=∬g(x,y)≤zf(x,y) dx dy
当z<0时,因为x、y都大于0,所以事件不可能发生
F Z ( z ) = 0 F_Z(z)=0 FZ(z)=0
当0≤z≤1时,画出图形:
根据图形可知
0 ≤ x ≤ z , 0 ≤ y ≤ z − x 0≤x≤z,0≤y≤z-x 0≤x≤z,0≤y≤z−x
F Z ( z ) = P ( Z ≤ z ) = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y = ∫ 0 z d x ∫ 0 z − x 2 d y = 2 ∫ 0 z ( z − x ) d x = 2 ( z x − 1 2 x 2 ) ∣ 0 z = z 2 F_Z(z)=P(Z≤z)=∬_{g(x,y)≤z}f(x,y) dx dy=\int_0^zdx\int_0^{z-x}2dy=2\int_0^z(z-x)dx=2(zx-\dfrac{1}{2}x^2)|_0^z=z^2 FZ(z)=P(Z≤z)=∬g(x,y)≤zf(x,y) dx dy=∫0zdx∫0z−x2dy=2∫0z(z−x)dx=2(zx−21x2)∣0z=z2
当1≤z≤2时,画出图形:
根据图形可知:
所求面积=1-右上角三角形面积S
S = ( 2 − z ) 2 2 S=\dfrac{(2-z)^2}{2} S=2(2−z)2
F Z ( z ) = P ( Z ≤ z ) = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y = 2 ( 1 − ( 2 − z ) 2 2 ) = 2 − ( 2 − z ) 2 F_Z(z)=P(Z≤z)=∬_{g(x,y)≤z}f(x,y) dx dy=2(1-\dfrac{(2-z)^2}{2})=2-(2-z)^2 FZ(z)=P(Z≤z)=∬g(x,y)≤zf(x,y) dx dy=2(1−2(2−z)2)=2−(2−z)2
当z>2时,超出x、y的取值范围,不可能发生
F Z ( z ) = 0 F_Z(z)=0 FZ(z)=0
所以:
F Z ( z ) = { z 2 , 0 ≤ z ≤ 1 1 − ( 2 − z ) 2 2 , 1 ≤ z ≤ 2 0 , 其它 F_Z(z)=\begin{cases} z^2,& 0\leq z\leq 1\\ 1-\dfrac{(2-z)^2}{2},& 1\leq z\leq 2\\ 0,& 其它 \end{cases} FZ(z)=⎩ ⎨ ⎧z2,1−2(2−z)2,0,0≤z≤11≤z≤2其它
求导:
f Z ( z ) = F z ′ ( z ) = { 2 z , 0 ≤ z ≤ 1 4 − 2 z , 1 ≤ z ≤ 2 0 , 其它 f_Z(z)=F_z'(z)=\begin{cases} 2z,& 0\leq z\leq 1\\ 4-2z,& 1\leq z\leq 2\\ 0,& 其它 \end{cases} fZ(z)=Fz′(z)=⎩ ⎨ ⎧2z,4−2z,0,0≤z≤11≤z≤2其它