第三章多维随机变量及其分布
第三章 多维随机变量及其分布
第三章是第二章内容的推广。由于从二维推广到多维一般无实质性的困难,我们重点讨论二维随机变量。学习本章请注意与一维情形的对照 。
一、二维随机变量
有些随机现象用一个随机变量来描述还不够,而需要用几个随机变量来描述. 如飞机的重心在空中的位置是由三个r.v (三个坐标)来确定的等等。
一般地,我们称n 个随机变量的整体X =(X 1, X2, …,X n ) 为n 维随机变量或随机向量。以下重点讨论二维随机变量。
1、二维离散型随机变量
若随机变量(X ,Y) 的所有可能取值是有限个或可数个,则称其为二维离散型随机变量。 (X ,Y) 为二维离散型随机变量当且仅当其每个分量都是离散型随机变量的随机向量。 我们把能反映二维离散型随机变量的所以不同取值及其概率的解析式(或表格)
P (X =x i , Y =y j ) =p ij ,
, i, j =1,2, …
称为(X ,Y )的概率分布(律,列)。它与一维同样具有非负性和完备性:
⎧p ij ≥0, i , j =1, 2,
⎪
⎨∑∑p ij =1⎪i j ⎩
例1 把一枚均匀硬币抛掷三次,设X 为三次抛掷中正面出现的次数,而Y 为正面出现次数与反面出现次数之差的绝对值,求(X ,Y) 的概率函数。
解:(X , Y )可取值(0,3),(1,1),(2,1) ,(3,3)
P (X =0, Y =3)=(1/2)3=1/8 P (X =1, Y =1)=3(1/2)3=3/8 P (X =2, Y =1)=3/8 P (X =3, Y
=0)=1/8
2、二维连续型随机变量 (1)定义与性质 若
P {(x , y ) ∈A }=⎰⎰f (x , y ) dxdy A ⊂ℜ2
A
则称(X , Y )是二维连续型随机变量,称 f (x , y ) 为(X , Y )的概率密度函数,简称密度。
同样有
⎰⎰
∞∞
-∞-∞
f (x , y ) dxdy =1
f (x , y ) ≥0
下面我们介绍两个常见的二维连续型分布。
(2)均匀分布 设G 是平面上的有界区域,其面积为A 。若二维随机变量( X , Y )具有概率密度
⎧1
⎪, (x , y ) ∈G
f (x , y ) =⎨A
⎪其它⎩0,
则称(X , Y )在G 上服从均匀分布。
(3)二维正态分布 若二维随机变量(X ,Y )具有概率密度
f (x , y ) =
12πσ1σ2-ρ2
exp{-
1x -μ12
[() -2ρ(x -μ1)(y -μ2) +(y -μ2) 2]}2
2(1-ρ) σ1σ1σ2σ2
其中μ1, μ2, σ1, σ2, ρ均为常数, 且,|ρ|
则称( X , Y )服从参数为μ1, μ2, σ1, σ2, ρ的二维正态分布.
3、二维随机变量的分布函数 称
F (x , y ) =P (X ≤x , Y ≤y ) -∞
为(X , Y )的分布函数。
不难得出,对连续型r.v (X ,Y ) ,其概率密度与分布函数的关系如下:
∂2F (x , y )
f (x , y ) =
∂x ∂y
F (x , y ) =⎰
4、边际分布
x
-∞-∞
⎰
y
f (u , v ) dudv
我们把X 和Y 的分布称为(X ,Y )的边际分布。(X ,Y )的分布称为X 和Y 的联合分布。 (1)(X , Y )的分布决定其边际分布 向量的概率分布律决定其边际分布律
对离散型 r.v ( X ,Y ) , 设X 和Y 的联合X 和Y 的联合概率函数为律为
P (X =x i , Y =y j ) =p ij ,
则(X ,Y) 关于X 的边缘概率函数为
i , j =1, 2,
(X,Y ) 关于Y 的边缘概率函数为
P (X =x i ) =p i ∙=∑p ij , i =1, 2,
j
P (Y =y i ) =p ∙j =∑p ij ,
i
j =1, 2,
向量概率密度律决定其边际密度
对连续型 r.v ( X , Y ),设X 和Y 的联合概率密度为f (x , y ) 则( X , Y ) 关于X 的边缘概率函数为( X , Y ) 关于Y 的边缘概率函数为
f X (x ) =⎰f (x , y ) dy
-∞∞-∞
∞
f Y (y ) =⎰
f (x , y ) dx
向量分布函数决定其边际分布函数
对任意r.v (X , Y ) ,X 和Y 的联合分布函数为F (x , y ) 则(X , Y ) 关于X 的边缘分布函数为(X , Y ) 关于Y 的边缘分布函数为
F X (x ) =lim F (x , y )
y →∞
F Y (y ) =lim F (x , y )
x →∞
例2 设(X ,Y) 的概率函数为
其边际分布律为
注意这两个分布正好是上表的行和与列和。边缘概率函数写在联合概率函数表格的边缘上,由此得出边缘分布这个名词.
例3 设(X , Y ) 的概率密度是
⎧cy (2-x ), 0≤x ≤1, 0≤y ≤x
f (x , y ) =⎨
0, 其它⎩
求 (1) c 的值; (2)两个边缘密度。
解:(1)
⎰⎰
∞∞
-∞-∞
f (x , y ) dxdy =c ⎰[x 2(2-x ) /2]dx =⎰[⎰cy (2-x ) dy ]dx
000 =5c /24=1, ⇒ c =24/5
11x
(2)
f X (x ) =⎰
=
x
24
y (2-x ) dy 5 0≤x ≤1
122
x (2-x ), 5
⎧122
⎪x (2-x ), 0≤x ≤1
f X (x ) =⎨5
⎪其它⎩0, 同理得
⎧243y 2⎪
f Y (y ) =⎨5y (2-2y +2), 0≤y ≤1
⎪0, 其它⎩
例4 参数为μ1, μ2, σ1, σ2, ρ的二维正态分布的边缘密度N (μ1,σ12)与N (μ2,σ22). 边缘分布一般不能确定联合分布(由例4可见,决定不了ρ)。那么要问,在什么情况下,由边缘分布可以唯一确定联合分布呢?
5、独立随机变量
两随机变量独立的定义是:设 X ,Y 是两个r.v ,若对任意的x ,y ,有
P (X ≤x , Y ≤y ) =P (X ≤x ) P (Y ≤y )
即 F (x , y ) =F X (x ) F Y (y )
则称X , Y 相互独立 。它表明,两个r.v 相互独立时,它们的联合分布函数等于两个边缘分布函数的乘积。
若 (X , Y ) 是连续型r.v ,则上述独立性的定义等价于:对任意的 x , y , 有
f (x , y ) =f X (x ) f Y (y )
其中f (x , y ) 是X , Y 的联合密度f X (x ), f Y (y ) 分别是X 的边缘密度和Y 的边缘密度。 若 (X , Y ) 是离散型r.v ,则上述独立性的定义等价于:
P (X =x i , Y =y j ) =P (X =x i ) P (Y =y j )
例5 设(X , Y ) 的概率密度为
等价为:对(X , Y ) 的所有可能取值(x i , y j ), 有p ij =(p ij )相邻行成比例。
⎧xe -(x +y ) ,
f (x , y ) =⎨
0, ⎩
问X 和Y 是否独立?
解
f X (x ) =
x >0, y >0
其它
⎰
∞
xe -(x +y ) dy
x >0
f Y (y ) =⎰xe -(x +y ) dx
得
∞
y >0
⎧xe -x , x >0⎧e -y , y >0
f X (x ) =⎨f Y (y ) =⎨
0, 其它其它⎩⎩0,
f (x , y ) =f X (x ) f Y (y ) 故X 和Y 独立 。
例6 若(X , Y ) 的概率密度为
⎧2, 0
f (x , y ) =⎨
其它 ⎩0,
问X 和Y 是否独立?
解:
f X (x ) =⎰2dy =2(1-x ),
x
1
0
f Y (y ) =⎰2dx =2y ,
y
0
由于f (x , y ) ≠f X (x ) f Y (y ) 故X 和Y 不独立 .
如果两个随机变量不独立,讨论它们的关系时,除了前面介绍的联合分布和边缘分布外,有必要引入条件分布的概念,这将在下面介绍。
6、条件分布
按照第一章中介绍的条件概率的概念可以得出:对两个r.v X, Y , 在给定Y 取某个或某些值的条件下X 的概率分布,这个分布就是条件分布。
(1)离散型r.v 的条件分布
定义1 设 (X ,Y ) 是二维离散型随机变量,对于固定的 j ,若P (Y =y j )>0,则称
P(X =xi |Y =yj )=
P (X =x i , Y =y j )
P (Y =y j )
=
p i j p ∙j
i =1,2, …
为在Y =y j 条件下随机变量X 的条件概率函数。条件分布是一种概率分布,它具有概率分布的一切
性质。例如:
P (X =x i |Y =y j ) ≥0,
i =1,2, …
∑P (X =x |Y =y ) =1
i
j
i =1
∞
例7 一射手进行射击,击中目标的概率为 p (0
解:依题意,{Y =n } 表示在第n 次射击时击中目标, 且在前n -1次射击中有一次击中目标。用{X =m }表示首次击中目标时射击了m 次。得X 和Y 的联合概率函数为
P (X =m , Y =n ) =p 2(1-p ) n -2 n =2,3, …; m =1,2, …, n -1
X 的边缘概率函数是:
P {X =m }=
n =m +1
∑P (X =m , Y =n ) =p
2
∞
2
n =m +1
∑(1-p ) n -2=
∞
n =m +1
∑p
∞
2
(1-p ) n -2
(1-p ) m +1-2
=p
1-(1-p )
Y 的边缘概率函数是:
=p (1-p ) m -1 m =1,2, …
n -1
P {Y =n }=∑P (X =m , Y =n ) =∑p 2(1-p ) n -2
m =1
m =1
n -1
=(n -1) p 2(1-p ) n -2 n =2,3, …
于是可求得:当n =2,3, …时,
P (X =m |Y =n )
p (1-p ) P {X =m , Y =n }
==
(n -1) p 2(1-p ) n -2P {Y =n }
2n -2
=
1
,
n -1 m =1,2, …,n -1
当m =1,2, …时,
P (Y =n |X =m )
P {X =m , Y =n }=
P {X =m }
p 2(1-p ) n -2=n -m -1
, p (1-p ) m -1=p (1-p )
n =m +1,m +2, …
(2)连续型r.v 的条件分布
设(X , Y ) 是二维连续型r.v ,由于对任意 x , y , P (X =x )=0, P (Y =y )=0 ,所以不能直接用条件概率公式得到条件分布,下面我们直接给出条件概率密度的定义。
定义2 设X 和Y 的联合概率密度为 f (x,y ), 边缘概率密度为则对一切使f X (x)>0的x , 定义已知 X =x 下,Y 的条件密度函数为
f X (x ), f Y (y )
f Y |X (y |x ) =
f (x , y )
f X (x )
同样,对一切使f Y (y ) >0的 y , 定义
f X |Y (x |y ) =
f (x , y ) f Y (y )
为已知 Y =y 下,X 的条件密度函数。
我们来解释一下定义的含义:以
f X |Y (x |y ) =
f (x , y ) f Y (y )
为例。将上式左边乘以 dx , 右边乘以 (dx dy) /dy即得
f X |Y (x |y ) dx =
f (x , y ) dxdy P {x ≤X
≈
f Y (y ) dy P {y ≤Y ≤y +dy }
f X |Y (x |y ) dx
=P {x ≤X ≤x +dx |y ≤Y
换句话说,对很小的dx 和 dy ,
表示已知 Y 取值于y 和y+dy之间的条
件下,X 取值于x 和x+dx之间的条件概率。
运用条件概率密度,我们可以在已知某一随机变量值的条件下,定义与另一随机变量有关的事件的条件概率。即:若(X ,Y ) 是连续型r.v , 则对任一集合A ,
P (X ∈A |Y =y ) =⎰f X |Y (x |y ) dx
A
特别,取A =(-∞, u ), 定义在已知 Y=y下,X 的条件分布函数为
F X |Y (u |y ) =P (X ≤u |Y =y ) =
例8 设(X,Y)的概率密度是
⎧e -x y e -y
, ⎪
f (x , y ) =⎨y
⎪0, ⎩
⎰
u
-∞
f X |Y (x |y ) dx
0
其它
求 P(X>1|Y=y)。
解: P (X >1|Y =y )
=⎰f X |Y (x |y ) dx
1
∞
为此, 需求出
f X |Y (x |y )
由于
-y
f Y (y ) =⎰f (x , y ) dx =⎰0
-∞
∞
∞
e -x y ∞e -x y e -y
[-ye ]dx =0y y
=e -y , 0
于是对y>0,
f (x , y ) e -x y
f X |Y (x |y ) ==,
f Y (y ) y x >0
故对y>0,
P(X>1|Y=y)
=⎰
∞
1
e -x y
dx =-e -x y
y ∞1
=e -y
可以证明,对二维正态分布,已知 X=x下,Y 的条件分布,或者已知 Y=y下,X 的条件分布都仍是正态分布.
例9 设数X 在区间(0,1)均匀分布,当观察到X=x(0
解:依题意,X 具有概率密度 ⎧1, 0
f X (x ) =⎨
⎩0, 其它
对于任意给定的值x (0
⎧1⎪,
f Y |X (y |x ) =⎨1-x
⎪⎩0,
X 和Y 的联合密度为
x
f (x , y ) =f X (x ) f Y |X (y |x )
⎧1⎪, =⎨1-x ⎪0, ⎩
其它
0
于是得Y 的概率密度为
∞
f Y (y ) =⎰
-∞
⎧y 1
⎪dx =-ln(1-y ), =⎨⎰01-x
f (x , y ) dx ⎪0, ⎩
0
7、二维随机变量函数的分布
在第二章中,我们讨论了一维随机变量函数的分布,现在我们先讨论两个随机变量的函数的分布问题,然后将其推广到多个随机变量的情形.
(1)离散型分布的情形
例10 若X 、Y 独立,P (X =k )=ak , k =0,1,2,…, P (Y =k )=bk , k =0,1,2,… ,求Z =X +Y 的概率函数。 解: P (Z =r ) =P (X +Y =r )
=∑P (X =i , Y =r -i ) =∑P (X =i ) P (Y =r -i )
i =0
i =0
r r
=a 0b r +a 1b r -1+…+a r b 0 r =0,1,2,
例11 若X 和Y 相互独立, 它们分别服从参数为λ1,λ2的泊松分布, 证明Z =X +Y 服从参数为
λ1+λ2 的泊松分布。
解:依题意
e -λ1λ1i e -λ2λ2j
P (X =i ) =P (Y =j ) =
i ! i =0,1,2,… j ! j =0,1,2,…
由卷积公式
P (Z =r ) =∑P (X =i , Y =r -i ) =∑e
i =0
i =0
r r
-λ1
i
λ1
i!
⋅e
-λ2
λr 2-i
(r-i)!
e -(λ1+λ2) =
r !
-(λ1+λ2) r! e i r -i
λ1λ2=(λ1+λ2) r , ∑r ! i =0i! (r-i)! r =0,1,…
r
即Z 服从参数为λ1+λ2 的泊松分布。
例3 设X 和Y 相互独立,X ~B (n 1, p ), Y ~B (n 2, p ), 求Z =X +Y 的分布。
我们给出不需要计算的另一种证法:若X ~ B (n 1,p), 则X 是在n 1次独立重复试验中事件A 出现的次数, 每次试验中A 出现的概率都为p 。同样,Y 是在n 2次独立重复试验中事件A 出现的次数, 每次试验中A 出现的概率为p 。
故Z =X +Y 是在n 1+n 2次独立重复试验中事件A 出现的次数,每次试验中A 出现的概率为p ,于是Z 是以(n 1+n 2,p )为参数的二项随机变量,即Z ~ B (n 1+n 2, p ) 。
(2)连续型分布的情形
已知(X ,Y )的分布密度f(x, y),求Z = g ( X,Y ) 的密度f Z (z)。 先要求出Z 的分布函数F Z (z),再通过求偏导得到。