1、其实,很多人都有你这个问题。那是因为一句完整的话或者说这句话是中心极限定理,被口口相传的时候,传丢了几个重要的内容后,变成的结果。
完整版本的话,或者中心极限定理的意思要表达的是这样“如果样本间是独立同分布,有相同的数学期望与方差,当样本随机从总体中抽取的数量足够大时,样本的均值服从N( μ, σ^2)的正态分布”
这种被传的残缺不全的话,还有这种版本“样本量超过30个时,近似服从正态分布”
2、有上述的分析可以得到,并不是样本大,就一定要服从正态分布。我们可以轻易举出一个反例来说明这个问题。比方说就用1-1000这一千个自然数,组成一个样本,那么这个样本根本就组成不了正态分布的,因为1-1000服从的是均匀分布。不信你可以试试看,保证天底下所有的统计软件都能证明它们不是正态分布。
那正确的做法,或者说想要搞成一个正态分布该如何做呢? 一种方法就是这样:
从1-1000这一千个自然数中,随机抽取30个数(可放回抽取),那么排列组合就有 1000的30次方种样本组,每个样本组都会有一个均值,那么这1000的30次方个均值,就非常近似的服从正态分布。不信的话,你可以试试(当然了,考虑到这么大的运算量电脑可能会烧掉,只要从1-50这五十个自然数中个,按上面的说法随机抽取30个数,就能证明)