概率论 第四章

随机变量的数字特征

定义:这些用来描述随机变量统 计特征的数字,称为随机变量的数字特征

​ 最常用的数字特征有:数学 期望(均值)、方差、相关系数和矩。

数学期望 E(x)

(Expectation)

定义

设离散型随机变量$X$的分布律为$P{X=x_k}=p_k,\quad (k=1,2,\ldots)$,若级数$\sum\limits_{k=1}^\infty x_kp_k$绝对收敛,则称级数$\sum\limits_{k=1}^\infty x_kp_k$的和为$X$的数学期望(均值),记为$E(X)$;

设连续型随机变量$X$的概率密度为$f(x)$,若积分$\int_{-\infty}^{+\infty}xf(x)dx$绝对收敛,则称级数$\int_{-\infty}^{+\infty}xf(x)dx$的和为$X$的数学期望(==均值==),记为$E(X)$;

image-20201218101413419

性质

  • $E(C)=C$
  • $E(CX)=CE(X)$
  • $E(X+Y)=E(X)+E(Y)$
  • 若$X$与$Y$相互独立,则$E(XY)=E(X)E(Y)$

六个常见随机变量的数学期望

(0-1)分布

$$ E(X)=p $$

二项分布 $B(n,p)$

$$ E(X)=np $$

泊松分布 $\pi(\lambda)$

$$ E(X)=\lambda $$

均匀分布 $U(a,b)$

$$ E(X)=\cfrac{a+b}{2} $$

指数分布 $e(\lambda)$

$$ E(X)=\cfrac{1}{\lambda} $$

正态分布 $N(\mu,\sigma^2)$

$$ E(X)=\mu $$

随机变量的函数的数学期望

  • $X$为离散型的,$Y=g(X)$的均值

    若$X$的分布律为$P{X=x_i}=p_i\quad (i=1,2,\ldots)$,则 $$ E(Y)=\sum\limits_{i=1}^\infty g(x_i)p_i $$

  • $(X,Y)$为离散型的,$Z=g(X,Y)$的均值

    若$(X,Y)$的分布律为$P{X=x_i,Y=y_i}=p_{i,j}\quad (i,j=1,2,\ldots)$,则 $$ E(Z)=\sum\limits_{i,j}g(x_i,y_i)p_{i,j} $$

  • $X$为连续型的,$Y=g(X)$的均值

    若$X$的概率密度为$f_X(x)$,则 $$ E(Y)=\int_{-\infty}^{+\infty}g(x)f_X(x)dx $$

  • $(X,Y)$为连续型的,$Z=g(X,Y)$的均值

    若$(X,Y)$的概率密度为$f(x,y)$,则 $$ E(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy $$

image-20201218105951288 image-20201218110057750 image-20201218110111093

方差 D(X)

(Variance)

定义

设$X$是一个对随机变量,若$E{[X-E(X)]^2}$存在,则称其为$X$的方差,记为$D(X)$或$Var(X)$

称$\sqrt{D(X)}$为标准差均方差,记为$\sigma(X)$

  • 认识

    标准差、方差越大,离散程度越大,若$X$的取值比较集中,则方差$D(X)$较小,若$X$的取值比较分散,则方差$D(X)$较大。因此,$D(X)$是刻画$X$取值分散程度的一个量,它是衡量取值分散程度的一个尺度

  • ==公式==

$$ D(X)=E(X^2)-[E(X)]^2 $$

性质

  • $D(C)=0$

  • $D(CX)=C^2D(X)$

  • $D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}$

    若$X$,$Y$相互独立,则有$D(X+Y)=D(X)+D(Y)$,又有$D(X-Y)=D(X)+D(Y)$

常见随机变量的方差

(0-1)分布

$$ D(X)=p(1-p) $$

二项分布 $B(n,p)$

$$ D(X)=np(1-p) $$

泊松分布 $\pi(\lambda)$

$$ D(X)=\lambda $$

均匀分布 $U(a,b)$

$$ D(X)=\cfrac{(b-a)^2}{12} $$

指数分布 $e(\lambda)$

$$ D(X)=\cfrac{1}{\lambda^2} $$

正态分布 $N(\mu,\sigma^2)$

$$ D(X)=\sigma^2 $$

==随机变量参考总结==

分布名称分布律或概率密度数学期望方差
(0-1)分布$P{X=k}=p^k(1-p)^{1-k}$$p$$p(1-p)$
二项分布 $B(n,p)$$P{X=k}=C_n^kp^k(1-p)^{n-k}$$np$$np(1-p)$
泊松分布 $\pi(\lambda)$$P{X=k}=e^{-\lambda}\cfrac{\lambda^k}{k!}$$\lambda$$\lambda$
均匀分布 $U(a,b)$$f(x)=\begin{cases}\ \cfrac{1}{b-a}\qquad a<x<b\ \ 0\qquad\qquad 其他\end{cases}$$\cfrac{a+b}{2}$$\cfrac{(b-a)^2}{12}$
指数分布 $e(\lambda)$$f(x)=\begin{cases}\ \lambda e^{-\lambda x}\qquad x\ge 0\ \ 0\qquad\qquad 其他\end{cases}$$\cfrac{1}{\lambda}$$\cfrac{1}{\lambda^2}$
正态分布 $N(\mu,\sigma^2)$$f(x)=\cfrac{1}{\sqrt{2\pi}\sigma}e^{-\cfrac{(x-\mu)^2}{2\sigma^2}}$$\mu$$\sigma^2$

image-20201218113426305

协方差

定义

设$(X,Y)$为二维随机变量,若$E{[X-E(X)][Y-E(Y)]}$存在,则称其为$X$和$Y$的协方差,记为$Cov(X,Y)$

  • ==公式==

$$ Cov(X,Y)=E(XY)-E(X)E(Y) $$

性质

  • $Cov(X,X)=D(X)$
  • $Cov(X,Y)=Cov(Y,X)$
  • $Cov(aX,bY)=abCov(X,Y)$
  • $Cov(C,X)=0$
  • $Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$
  • 当$X$与$Y$相互独立时,$Cov(X,Y)=0$
  • $D(aX+bY)=a^2D(X)+b^2D(Y)+2abCov(X,Y)$

相关系数

定义

设$(X,Y)$为二维随机变量,$D(X)>0,D(Y)>0$,称 $$ \cfrac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} $$ 为$X$和$Y$的相关系数,记为$\rho_{XY}$。其值为 0 时,$X$和$Y$不相关

性质

  • $|\rho_{XY}|\le 1$

  • 当$X$与$Y$相互独立时,$\rho_{XY}=0$,$X$和$Y$不相关

  • 若$D(X)>0,D(Y)>0,|\rho_{XY}|=1\Leftrightarrow 存在常数 a,b,使得 P{Y=aX+b}=1$

    而且当$a>0$时,$\rho_{XY}=1$,当$a<0$时,$\rho_{XY}=-1$

==相关系数刻画了随机变量$X$与$Y$之间”线性相关“的程度==

image-20201221110802057
  • $X^*=\cfrac{X-E(X)}{\sqrt{D{X}}}$是对随机变量$X$的标准化,有

$$ \rho_{XY}=Cov(X^,Y^) $$

  • 对于二维正态分布来说,不相关$\Leftrightarrow$独立

image-20201228112938854 image-20201228112956332

不相关与独立

独立:没有任何关系

不相关:没有线性关系

$独立 \Rightarrow 不相关 \ 不相关 \nRightarrow 独立$

二维随机变量中,两者等价

定义

设$X,Y$是随机变量

  • 若$E(X^k),k=1,2,\ldots$存在,称它为$X$的$k$阶原点矩,简称**$k$阶矩**
  • 若$E{[X-E(X)]^k},k=2,3,\ldots$存在,称它为$X$的**$k$阶中心矩**
  • 若$E(X^kY^l),k,l=1,2,\ldots$存在,称它为$X$和$Y$的**$k+l$阶混合矩**
  • 若$E{[X-E(X)]^k[Y-E(Y)]^l},k,l=2,3,\ldots$存在,称它为**$X$和$Y$的$k+l$阶混合中心矩**

数学期望为一阶原点矩,方差为二阶中心矩,协方差为二阶混合中心矩

协方差矩阵

设$n$维随机变量$(X_1,X_2,\ldots,X_n)$的二阶混合中心矩$E{[X_i-E(X_i)][Y_j-E(Y_j)]}\triangleq c_{i,j}, (i,j=1,2,\ldots,n)$都存在,则称矩阵 $$ \begin{pmatrix} c_{11}&c_{12}&\ldots&c_{1n} \ c_{21}&c_{22}&\ldots&c_{nn}\ \vdots&\vdots&\vdots&\vdots \ c_{n1}&c_{n2}&\ldots&c_{nn} \end{pmatrix} $$ 为$n$维随机变量$(X_1,X_2,\ldots,X_n)$的协方差矩阵