滑行时间的统计实验1

我一直对统计学有着浓厚的兴趣,可惜大学时的知识都荒废了。最近在带孩子之余看了点网易公开课的统计学入门,受益匪浅。一下内容就当是一次实验。如有错误之处,望指出。

首先,我从数据库中导出了最近一年所有737NG飞机的浦东机场出港撤轮档时间和实际起飞时间,两者之差就是滑行时间。选择737机型是因为737的ACARS比老飞机好。推出时间准确,减少手工输入时间上的偏差。不过还是有3%左右的数据是不符合逻辑的,可以从数据中剔除。最后有效数据一共11509个。

以下是这11509个数据的分布图,均值19.21772分钟,标准差6.597764分钟:

从偏度和峰度看都不能看作正态分布。根据中心极限定理,N次抽样后,抽样的均值就会服从正态分布。抽样的个数我选择11509/365=31.53,也就是平均每一天浦东的出港航班数。以下是抽样的均值分布图,均值19.22,标准差1.1749:

如果要求99.9%的置信区间,查表得3.1个标准差。19.22 + 1.1749 × 3 = 22.86分钟。

结论:我可以有99.9%的信心保证,过去一年中的任何一天,在浦东出港的滑行时间的平均值都在22.86分钟以下。

发表回复