大家好,我是讯享网,大家多多关注。
总体均值μ的置信区间公式可由样本均值x-的抽样分布得到。在实践中,总体均值的置信区间的计算方法根据样本量N的大小而不同,取决于总体标准差σ是否已知。
σ已知
如果变量x服从均值为μ,标准差为σ的正态分布,那么通过公式1的变换,它服从标准正态分布。
1式:标准正态分布统计量z1:标准正态分布统计量z
根据标准正态分布定律,95%的Z值在-1.96到1.96之间,也就是说
从而获得95%的置信区间:
更一般的情况:
σ已知、服从正态分布的总体均数μ可信区间的计算公式已知σ和正态分布的总体均值μ的置信区间计算公式
Z/2是标准正态分布的双边界值,即标准正态分布左右两边的概率之和为α时的上边界值。如果1-α=0.95,则为总体平均值的95%置信区间,如果1-α=0.99,则为总体平均值的99%置信区间。
σ未知
实际上,总体标准差σ通常是未知的,所以我们可以用它的估计量S来代替σ,但在这种情况下,公式1中的(x ─-μ)/(s/√ n)不再服从标准正态分布,而是服从著名的T分布。
式2:t分布公式求统计量t2:t分布公式求统计量t。
正态分布总体中的抽样,(x-μ)/(s/√ n)服从自由度n = v-1的t分布。
v值不同的t分布曲线不同v值的t分布曲线
随着自由度V的增加,t分布曲线更接近标准正态分布曲线。当n趋近于无穷大时,t分布的极限分布就是标准正态分布。
t分布不是一条曲线,而是一簇曲线。
所以t分布曲线下95%区域的边界值不是一个常数,它随自由度而变化。
为方便应用,可根据书中附表找到相应的T边界值。T-bound表中给出了不同自由度下单侧概率和双侧概率对应的T-bound值。例如,当v=24,双边概率α=0.05时,从表中可得t0.05/2,24=2.064,其中2.064为双边尾部概率分别为0.025的T边界值。
根据t分布定律,95%的t值在-t0.05/2,v到t0.05/2,v之间,也就是说
从而获得95%的置信区间:
更一般的情况:
注:在大样本(n >: 50)的情况下,不管变量x是否服从正态分布,根据中心极限定理,样本均值服从正态分布,t分布逼近标准正态分布。置信区间可以通过以下公式近似计算:
本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://51itzy.com/39726.html