虹桥飞机场出租车数据分析报告
----逗留时间
张应山
华东师范大学金融与统计学院
从数据我们可以得到五种数据:
label yy1='逗留时间=等待时间+服务时间'; f10
label yy2='排队长度'; fi中非零数据个数
label yy3='服务时间'; 做差fi-f(i-1)
label yy4='服务流量'; 单位时间(一小时)内fi中非零数据个数
label yy5='顾客流量'; 一天内fi中非零数据个数
下面对逗留时间数据进行分析。服务时间数据分析类似。
识别性分析:识别原始数据
对原始数据进行原始识别处理,先画柱状图形(直方图)和饼状图形如下
从图形可以猜想,其图形是伽玛分布。
伽玛分布的矩估计为
alpha= myyy**2/(ssyy**2);
lambdagjPJZ=myyy /(ssyy**2); .002997944
伽玛分布在alpha给定时lambda的区间估计为(见Guenther(1969),shortest confidence intervals, Amer. Statist. 23(1), ; (1971), Amer. Statist. 23(1), , )
lambdaxx=cinv(,2*alpha*mn)/(2*mn*myyy); .002704386
lambdaL=cinv(,2*alpha*mn)/(2*mn*myyy); .002651098 lambdaU=cinv(,2*alpha*mn)/(2*mn*myyy); .003365802
lambdaSx=cinv(,2*alpha*mn)/(2*mn*myyy); .003304115
lambdagjzws=cinv(,2*alpha*mn)/(2*mn*myyy); .002994246
稳健性分析:比较各种估计的差别
两种估计比较接近。用两种估计的平均值作为参数lambda 的估计应是比较稳健的“lambdaqz=(lambdagjZWS+lambdagjPJZ)/2;
.002996095.
由于参数alpha未知,所以在参数alpha>1估计正确时,估计分布众数为ppzz=(alpha-1)/lambda,此与经验分布函数的众数(ppz0)应一致才稳健,两者差 good= ppzz- ppz0 应越小越好。
3. 协调性分析:比较估计分布与经验分布
:诊断估计分布与经验分布图形的协调性
以上述参数作为伽玛分布的估计与经验分布函数的比较图形为
如果原始数据是伽玛分布,那么将经验分布函数和数据变换后的图形(概率纸)应是直线.
fun1= sum/(nn+1);
fun2=probgam(yy*&lambda, &alpha);
yyy=log((yy*&lambda)**(&alpha));
fun3=log(log(1/(1-fun1)));
fun4=log(log(1/(1-fun2)));
将估计分布与经验分布函数和数据变换后的图形画在一张图上,得到图形如下:
从图形看出拟合不好.
:估计分布与经验分布理论的协调性
用柯尔莫哥洛夫统计量进行拟合检验没有通过.
n= 187 = = > ()
其中n为数据个数,而Dn为经验分布函数和拟合分布的最大差值,
。
柯尔莫哥洛夫定理:设总体的分布函数连续,
相应的经验分布函数为,记为统计量的分布
函数,其中
== 此处=
则的极限分布函数为
= =
函数与的形式无关,的值已有表可查,参考文献(中国科学院数学研究所概率统计室(1974),常用数理统计用表。科学出版社)。.
:变换原始数据
上述分布的各种参数为
lambdagj
mn myy c d ssyy maxyy minyy pz yyp50 mu myyy alpha PJZ lambdaxx
187 1 1 1679 0 0 386 0 .002997944 .002704386
lambdaL lambdaU lambdaSx lambdagjzws ppzz good lambdaqz p ssyy1 CL
.002651098 .003365802 .003304115 .002994246 .002996095
虹桥飞机场出租车数据分析报告 来自淘豆网m.daumloan.com转载请标明出处.