数据分析--------统计学-----------置信区间例题1

tech2024-11-02  20

从农场的20万个苹果中抽样一次,抽取36个苹果作为样本,样本中苹果重量的均值是112克,标准差是40克。问20万个苹果的重量均值处在100到124克之间的概率。


首先介绍样本均值的抽样分布(中心极限定理)

设总体有N个元素,从中随机抽取一个容量为n的样本,计算出这个样本的均值。重复上述操作(假设100000次),每次得到的均值所形成的分布是样本均值的抽样分布。

当总体服从正态分布时,样本均值一定服从正态分布,即有X~N( )时,

若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30),样本均值仍会接近正态分布。样本分布的期望值为总体均值,样本方差为总体方差的1/n 。这就是统计上著名的中心极限定理。该定理可以表述为:从均值为μ、方差为σ^2(有限)的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n ≥30),样本均值的分布近似服从均值为μ ,方差为σ^2/n 的正态分布。

如果总体不是正态分布,当n为小样本时(通常n<30),样本均值的分布则不服从正态分布,服从t分布。

下图为样本均值的抽样分布

绿色部分为样本均值的均值μ,样本均值的期望=总体期望,样本均值的方差=总体方差/样本容量


题目要求的是20万个苹果的重量均值处在100到124克之间的概率。其中20万个苹果是总体,一次样本的均值是112,100到124是一次样本均值的12范围。题目的要求是求总体均值在一次样本均值的12范围内的概率   等价于   一次样本均值在总体均值的12范围的概率(因为你在我12英尺范围内的概率=我在你12英尺范围内的概率)  等价于  一次样本均值落在所有样本均值的均值的12范围内(因为所有样本均值的均值即样本均值的期望=总体均值)。这个就可以转化为处理一个样本均值与样本均值期望之间的关系,如下方图像。即求一次样本均值落在粉色区域的概率。根据标准化的方法求x-μ/σ,就可以按照标准正态分布的方式来计算。但此处只知道了|x-u|=12,还不知道σ(总体标准差)


可以用样本方差来近似总体方差,总体标准差可以用样本标准差来近似。因为https://www.zhihu.com/question/20099757?sort=created


样本均值的方差=总体方差/样本容量,样本均值的标准差=总体标准差/样本容量开根

样本标准差可以估计总体标准差,所以总体标准差的最佳估计值是40。样本6均值的标准差是40/6

样本均值的z分数=|12|/40/6=|1.8|,求落在-1.8到1.8的概率,=P(1.8)-P(-1.8),查z分数的表,得P(1.8)=0.9641。

得到概率为0.9282

最新回复(0)