MelonCholi 收录于专业课

2021-10-23 约 2606 字预计阅读 6 分钟

多维随机变量及其分布

二维随机变量

定义

设$E$是一个随机试验，它的样本空间为$S$，设$X=X(e), Y=Y(e)$是定义在$S$上的两个随机变量，由它们构成的向量$(X,Y)$，叫做二维随机变量（也称随机矢量）

分布函数及其性质

设$(X,Y)$是一个二维随机变量，对任意的实数$x,y$，定义 $$ F(x,y)=P({X\le x}\cap {Y\le y})\triangleq P{X\le x,Y\le y} $$ 则称$F(x,y)$为二维随机变量$(X,Y)$的分布函数。

性质
- $F(x,y)$是关于变量 x 和 y 的不减函数
- $0\le F(x,y)\le 1$
- $F(-\infty,y)=\lim\limits_{x\rightarrow-\infty}F(x,y)=0,\quad F(x,-\infty)=\lim\limits_{y\rightarrow-\infty}F(x,y)=0\ F(-\infty,-\infty)=\lim\limits_{x,y\rightarrow-\infty}F(x,y)=0\ F(+\infty,+\infty)=\lim\limits_{x,y\rightarrow+\infty}F(x,y)=1$
- $F(x,y)$既关于 x 右连续（$F(x+0,y)=F(x,y)$），也关于 y 右连续（$F(x,y+0)=F(x,y)$）

二维离散型随机变量及其分布

若二维随机变量$(X,Y)$只有有限或可列个取值对，则称$X,Y$为一个二维离散型随机变量

若随机矢量$(X,Y)$所有可能取值对为$(x_i,y_i),(i=1,2,\ldots,j=1,2,\ldots)$

则称 $$ P({X=x_i}\cap{Y=y_i})\triangleq {X=x_i,Y=y_i}=P_{i,j} \(i=1,2,\ldots,j=1,2,\ldots) $$ 为$(X,Y)$的分布律或称联合分布律。

联合分布律可以更直观地用以下表格的形式来描述

其中$p_{i,j}(i=1,2,\ldots,j=1,2,\ldots)$要满足以下条件

$p_{i,j}\ge 0$
$\sum\limits_{i=1}^\infty\sum\limits_{j=1}^\infty p_{i,j}=1$

二维连续型随机变量及其概率密度

二维连续型随机变量的定义

设$(X,Y)$为二维随机变量，$F(x,y)$为其分布函数，若存在一个非负二元

函数$f(x,y)$，使得对任意$x,y$有 $$ F(x,y)=\int_{-\infty}^x\int_{-\infty}^y f(s,t)dsdt $$ 则称$(X,Y)$为二维连续型随机变量，并称$f(x,y)$为$(X,Y)$的概率密度，

或称为$X$和$Y$的联合概率密度

二维概率密度的性质

$f(x,y)\ge 0$
$\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x,y)dxdy=1$
$P{(X,Y)\in D}=\iint\limits_D f(x,y)dxdy$（其中的$D$为一个平面区域）
$f(x,y)=\cfrac{\partial ^2 F(x,y)}{\partial x\partial y}$

两个常见的二维连续型随机变量

二维均匀分布

$(X,Y)$的概率密度为 $$ f(x,y)=\begin{cases} \ \cfrac{1}{A}\qquad (x,y)\in G \ \ 0\qquad \quad 其他 \end{cases}\quad \其中 G 为平面上的一个有界区域，A 为其面积（即 S(G)） $$

二维正态分布

$(X,Y)$的概率密度为 $$ f(x,y)=\cfrac{1}{2\pi \sqrt{1-\rho^2}\sigma_1\sigma_2}exp{\cfrac{-1}{2(1-\rho^2)}\left[ \bigg(\cfrac{x-\mu_1}{\sigma_1}\bigg)^2-2\rho \bigg(\cfrac{x-\mu_1}{\sigma_1}\bigg)\cdot \bigg(\cfrac{y-\mu_2}{\sigma_2}\bigg)+\bigg(\cfrac{y-\mu_2}{\sigma_2}\bigg)^2 \right]} $$

记作$(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$

边缘分布

（Marginal Distribution）

概念

对于二维随机变量 w$(X,Y)$，其分布函数为 $F(x,y)$，它的每个分量 $X$ 和 $Y$ 都是一维随机变量，它们各自的分布函数分别为 $F_X(x)$ 和 $F_Y(y)$，通常把它们称为 $(X,Y)$ 关于 $X$ 和 $Y$ 的边缘分布函数。

接下来我们考察一下联合分布函数$F(x,y)$与边缘分布函数$F_X(x)$和$F_Y(y)$的关系： $$ F_X(x)=P{X\le x}=P{X\le x,Y<+\infty}=F(x,+\infty)\F_Y(y)=P{Y\le y}=P{X< +\infty,Y\le y}=F(+\infty,y) $$

二维离散型随机变量的边缘分布律

$$ F_X(x)=F(x,+\infty)=\sum\limits_{x_i\le x}\sum\limits_{j=1}^{+\infty}p_{i,j} $$

（注意：对一维随机变量$X$，$F_X(x)=\sum\limits_{x_i\le x}p_i$）

所以关于$X$的边缘分布律为 $$ P{X=x_i}=\sum\limits_{j=1}^\infty p_{i,j}\triangleq p_{i\cdot} \qquad(i=1,2,\ldots) $$ 类似地，关于$Y$的边缘分布律为 $$ P{Y=y_i}=\sum\limits_{i=1}^\infty p_{i,j}\triangleq p_{j\cdot} \qquad(j=1,2,\ldots) $$

二维连续型随机变量的边缘概率密度

设二维连续型随机变量$(X,Y)$的联合概率密度为$f(x,y)$，则 $$ F_X(x)=F(x,+\infty)=\int_{-\infty}^x\left[ \int_{-\infty}^{+\infty}f(s,t)dt \right]ds \ 对一维连续型随机变量 X，F_X(x)=\int_{-\infty}^{x}f_X(t)dt $$ 所以，==关于$X$的边缘概率密度==为 $$ f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy $$ 同样地，==关于 $Y$ 的边缘概率密度==为 $$ f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx $$

例

条件分布

（Conditional Distribution）

二维离散型随机变量的条件分布律

设$(X,Y)$是二维离散型随机变量，其分布律为 $$ P{X=x_i,Y=y_i}=p_{i,j}\qquad i,j=1,2,\ldots $$ 的概率，即求事件 $$ {X=x_i|Y=y_i}\qquad i=1,2,\ldots $$ 的概率。由条件概率公式可得 $$ P{X=x_i|Y=y_i}=\cfrac{P{X=x_i,Y=y_i}}{P{Y=y_i}}=\cfrac{p_{i,j}}{\sum\limits_{i=1}^{\infty}p_{i,j}}\qquad i=1,2,\ldots $$ 其为在$Y=y_i$的条件下随机变量$X$的==条件分布律==

类似地，称 $$ P{Y=y_i|X=x_i}=\cfrac{P{X=x_i,Y=y_i}}{P{X=x_i}}=\cfrac{p_{i,j}}{\sum\limits_{j=1}^{\infty}p_{i,j}}\qquad j=1,2,\ldots $$ 为在$X=x_i$的条件下随机变量$Y$的条件分布律

二维连续型随机变量的条件概率密度

考的不多

联合密度比边缘密度

称 $$ f_{X|Y}(x|y)=\cfrac{f(x,y)}{f_Y(y)} $$

为在$Y=y$条件下$X$的==条件概率密度==，记为$f_{X|Y}(x|y)$

同时称 $$ F_{X|Y}(x|y)=\int_{-\infty}^x\cfrac{f(s,y)}{f_Y(y)}ds=\int_{-\infty}^xf_{X|Y}(x|y)dx $$

为在$Y=y$条件下$X$的==条件分布函数==，记为$F_{X|Y}(x|y)$或$P{X\le x|Y=y}$

类似地，定义 $$ f_{Y|X}(y|x)=\cfrac{f(x,y)}{f_Y(x)}\ F_{Y|X}(y|x)=\int_{-\infty}^y\cfrac{f(x,t)}{f_X(x)}dt $$ 例

随机变量的独立性

二个随机变量独立性的概念

联合密度 = 边缘密度相乘
边缘密度 = 条件密度

设$F(x,y),F_X(x),F_Y(y)$分别为二维随机变量$(X,Y)$的联合分布函数和边缘分布函数，若对任意的$x,y$，都有 $$ F(x,y)=F_X(x)F_Y(y) \quad 即\ P{X\le x,Y\le y}=P{X\le x}P{Y\le y} $$

==独立的条件==

离散型：$P{X= x_i,Y= y_j}=P{X= x_i}P{Y= y_j}$ 对任意 i, j 成立
连续型：$f(x,y)=f_X(x)f_Y(y)$

例

对于连续型随机变量$(X,Y)$，若$X$与$Y$相互独立，当且仅当 $$ f_X(x)=f_{X|Y}(x|y) \ 或 \ f_Y(y)=f_{Y|X}(y|x) $$ 若$(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$，则 $$ f_X(x)=\cfrac{1}{\sqrt{2\pi}\sigma_1}e^{-\cfrac{(x-\mu_1)^2}{2\sigma_1^2}},\quad f_X(x)=\cfrac{1}{\sqrt{2\pi}\sigma_2}e^{-\cfrac{(x-\mu_2)^2}{2\sigma_2^2}} $$ 对于二维正态随机变量$(X,Y)$，相互独立的充要条件为 $\rho=0$

多维随机变量的独立性

$n$维随机变量$(X_1,X_2,\ldots ,X_n)$的分布函数定义为 $$ F(x_1,x_2,\ldots,x_n)=P{X_1\le x_1,X_2\le x_2,\ldots,X_n\le x_n} $$ 若对于所有$x_1,x_2,\ldots,x_n$，有 $$ F(x_1,x_2,\ldots,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)\ldots F_{X_n}(x_n) $$ 则称$X_1,X_2,\ldots ,X_n$是相互独立的

两个随机变量的函数的分布

二维连续型随机变量的函数的分布

一般的二维连续型随机变量的函数的分布

设$(X,Y)$是二维随机变量，其概率密度为$f(x,y)$，$Z=g(X,Y)$是一个二维随机变量的函数，==则== $$ F_Z(z)=P{Z\le z}=P{g(X,Y)\le z}=\iint\limits_{D_z} f(x,y)dxdy \ 其中 D_z={(x,y)|g(x,y)\le z} $$ 例

$Z=X+Y$的分布

设$(X,Y)$是二维随机变量，其概率密度为$f(x,y)$，则$Z=X+Y$的分布函数为 $$ F_Z(z)=\int_{-\infty}^z[\int_{-\infty}^{+\infty}f(u-y,y)dy]du $$ 其概率密度为 $$ f_{X+Y}(z)=\int_{-\infty}^{+\infty}f(z-y,y)dy=\int_{-\infty}^{+\infty}f(x,z-x)dx $$

例

$Z=\cfrac{Y}{X},Z=XY$的分布

设$(X,Y)$是二维随机变量，其概率密度为$f(x,y)$，则$Z=\cfrac{Y}{X}$的分布函数为 $$ f_{\frac{Y}{X}}(z)=\int_{-\infty}^{+\infty}|x|f(x,xz)dx $$ 也可以求得$Z=XY$的概率密度为 $$ f_{XY}(z)=\int_{-\infty}^{+\infty}\cfrac{1}{|x|}f(x,\cfrac{z}{x})dx $$

$M=max{X,Y},N=min{X,Y}$ 的分布

设 $(X,Y)$ 是二维随机变量，其概率密度为 $f(x,y)$，则 $M=max{X,Y}$ 的分布函数为 $$ F_{max}(z)=F_X(z)F_Y(z) $$ $N=min{X,Y}$ 的分布函数为 $$ F_{min}(z)=1-[1-F_X(z)][1-F_Y(z)] $$

扩展
设$X_i(i=1,2,\ldots,n)$是$n$个相互独立的随机变量，它们的分布函数为$F_{x_i}(x)$，则$M=max{X_1,X_2,\ldots,X_n}$和$N=min{X_1,X_2,\ldots,X_n}$的分布函数分别为

$$ F_{max}(z)=F_{x_1}(z)F_{x_2}(z)\ldots F_{x_n}(z) \ \qquad \ F_{min}(z)=1-[1-F_{x_1}(z)][1-F_{x_2}(z)]\ldots [1-F_{x_n}(z)] $$

例

二维离散型随机变量的函数的分布

注意：若$X$和$Y$相互独立
- 若$X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)$，则$X+Y\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$
- 若$X\sim e(\alpha),Y\sim e(\beta)$，则$min(X,Y)\sim e(\alpha+\beta)$
- 若$X\sim B(n_1,p),Y\sim B(n_2,p)$，则$Z=X+Y\sim B(n_1+n_2,p)$
- 若$X\sim \pi(\lambda_1),Y\sim \pi(\lambda_2)$，则$Z=X+Y\sim \pi(\lambda_1+\lambda_2)$

概率论 第三章