大家好,我是讯享网,大家多多关注。
什么是正态分布?
正态概率分布是连续随机变量概率分布的最重要形式,在实践中有着广泛的应用。生活中有很多现象是服从正态分布的,比如人的身高,体重,智商得分。产品的大小和质量;降雨量;学术成果,特别是在统计推断中,当样本数量足够大时,很多统计数据服从正态分布。以下面这个人的身高为例。什么是正态分布?
随机选取200名同龄男性,测量身高后计算平均身高。通过平均身高和各自身高的对比,我们很容易发现这个现象:大部分男性身高在平均身高上下波动,少数男性比较矮,少数男性很高。男性身高200的概率密度函数可能如下图所示:
其实这种形状很常见,应用也很广泛。它被称为正态分布。
正态分布的概率密度函数
正态分布之所以称为正态,是因为它的形状看起来很合理。在现实生活中,当遇到大量的连续数据如测量值时,期望看到这种形式是很正常的。正态分布概率密度函数的计算公式如下:
其中=均值,σ =标准差,π = 3.14159,e = 2.71828。如果随机变量X符合上述概率密度函数的分布,则称X为参数为σ2的正态分布,记为X ~ N (σ2)。
正态分布的概率密度函数具有以下性质:
以x =为对称轴的对称分布;
σ2指的是离差。σ2值越大,正态分布的曲线越平坦越宽;
以x轴为渐近线;
如果随机变量X1,X2…,Xn都服从正态分布且相互独立,任意数量的常数a1,a2,…,an(不全是0),z = a1x1+a2x2+…+anxn也服从正态分布。
正态分布的概率
在《每天一点统计——概率密度函数》中,我们已经知道了如何利用概率密度函数求概率。但是正态分布中的概率是很难找到的,也不可能提供包含所有异和σ的正态分布表。所以统计学家用一个简单的方法解决了这个问题。对于一个随机变量x ~ n(,σ2),若z = (x-)/σ(标准分数),则随机变量z服从正态分布= 0,σ 2 = 1,称为标准正态分布。
标准正态分布的概率密度函数为:
从上式可以看出,标准正态分布不再依赖于参数和σ,它是固定的,唯一的。从而计算出标准正态分布中随机变量与其概率的对应关系,并将其列为标准正态概率分布表进行查询。所以对于不同的和σ,只要把变量值转换成Z值,然后查表就可以得到它的概率值。
标准正态概率分布表
例:已知研究生完成硕士论文的时间服从正态分布,平均需要2500h小时,标准差为400h小时。现在,随便找一个已经完成论文的学生。查找:
(1)他完成论文花费超过2700小时的概率;
(2)他完成论文的时间少于2000小时的概率;
(3)他完成论文的时间在2400 h到2600 h之间的概率。
解法:用X表示完成论文的时间,然后X ~ N (2500,400 * 400)。这是非标准的正态分布。如果直接计算概率很麻烦,我们就先转换成标准正态分布,然后通过标准正态分布表,找出变量的概率值。
(1)求p(x >);2700)
Z=(x- )/σ=(2700-2500)/400=0.5
可以查询标准正态分布概率表。表格中的第一列是Z值,第一行是Z值的补充值。现在对z=0.5计算0.5到+∞区间内的概率,即1-0.6915 = 0.3085。
(2)求p (x < 2000)
Z=(x- )/σ=(2000-2500)/400=-1.25
根据正态分布的对称性,1.25的概率值与-1.25的概率值是完全对称的,所以只能检查1.25的概率值。当Z=1.25时,P(1.25)=0.8944,则P(-1.25)= 1-P(1.25)=0.1056。
(3)求p(2400 < X & lt;2600)
Z1=(x- )/σ=(2600-2500)/400=0.25
z2 =(x-)/σ=(2400-2500)/400 =-0.25
查标准正态分布概率表,可以得到P (0.25) = 0.5987,P (-0.25) = 0.4013。
p(2400 & lt;x & lt2600)= P(x & lt;2600)-P(x & lt;2400) = 0.5987 – 0.4013 = 0.1974
本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://51itzy.com/42978.html