关于统计与概率——大数定律的证明及一些推论
数学书上在频率的稳定性这一节介绍了大数定理,我认为这是一个非常重要且基本的定理,甚至可以作为广义概率的定义,而不只局限于古典概型的概率定义以及不大具体的语言描述
而且由大数定理我们可以做出一些推论并解释一些现象,比如为什么数学书统计学那一节的课外拓展内容(二战坦克问题)为什么抽到的编号总是大概均匀的,为什么样本的平均数及方差可以预测总体平均数……然而这些问题书上并没有给出证明但好在给出了一些提示
那么现在就让我简述一下我在这些问题上的思考
大数定理
关于大数定理,书上是这样写的
“大量试验表明,在任何确定次数的随机试验中,一个随机试验A发生的概率具有随机性.一般地,随着试验次数n的增大,频率偏离概率的幅度会越小,即事件A发生的频率
这里便可见事件A发生的频率
假设事件A发生的概率为p,那么总试验次数为n,事件A发生的次数为m时的概率f(m)为
tips:
所以我们现在就只需要计算它的单调性
因为它是离散函数所以我们可以使用做差法
因为
所以
因为
所以 当
所以
所以当
当
所以函数f(m)是一个单峰函数且最大值点在
而
所以即可证明事件A发生的频率
推论
1.关于均匀分布的推论
因为在二战坦克那个问题中只有在均匀分布的情况下任意区间之间的样本个数比才约等于区间内数字个数比
2.平均数与方差
首先我们先把所有数字先排序再分成两半一半数字小于平均数一半大于等于平均数。
然后由大数定理可知两半中抽出的数字之比近似等于两半中数字之比
那么如果每一半中抽出数的平均数都能预测该半组数的平均数那么根据公式
而对于每一半数字我们发现我们要做的事情和原数据相同即证明它中抽取的样本的平均数可以预测总体平均数
那么我们就可以继续把每一半再分成两半一直持续下去,最后当我们在某个很小的区间里只能抽取一个数字时,因为它的区间相对于总体非常小,所以这里面的每一个数都可以当成它的平均数
由此一层层往上回溯即可证明总体中抽取的样本的平均数可以预测总体平均数
同理,我们可以得到总体中抽取的样本的平方平均数可以预测总体的平方平均数
而我们知道方差即等于平方平均数减平均数的平方
所以证明完毕!!!