虹桥飞机场出租车数据分析报告---排队长度张应山华东师范大学金融与统计学院从数据我们能够得到五种数据:labelyy1='逗留时间=等待时间+服务时间';f10labelyy2='排队长度';fi中非零数据个数labelyy3='服务时间';做差fi-f(i-1)labelyy4='服务流量';单位时间(一小时)内fi中非零数据个数labelyy5='顾客流量';一天内fi中非零数据个数下面对排队长度数据进行分析。服务流量、顾客流量数据分析类似。识别性分析:识别原始数据对原始数据进行原始识别处理,先画柱状图形(直方图)和饼状图形如下从图形能够猜想,其图形是普松分布。普松分布的一阶矩估计为myyy=myy-minyy;lambda1=myyy;普松分布的二阶矩估计为lambda2=ssyy**2;普松分布的区间估计为(见茆诗松和周纪芗,概率论与数理统计,中国统计出版社,,p334-337)lambdaxx=mn*myyy;arraykk[1000]kk1-kk1000;dok=1to1000;kk[k]=1-poisson(lambdaxx,k)-probchi(2*lambdaxx,2*(k+1));ifk>2andkk[k]<0thengotook;end;ok:;lambdaxx=cinv(,2*k)/(2*mn);lambdal=cinv(,2*k)/(2*mn);lambdau=cinv(,(2*k+1))/(2*(mn));lambdasx=cinv(,2*k)/(2*mn);lambdazwqj=cinv(,2*k)/(2*mn);稳健性分析:比较各种估计的差别普松分布的一阶矩估计和普松分布的区间估计两种估计比较接近,但普松分布的二阶矩估计与前两者差别很大。用三种估计的平均值作为参数lambda的估计应是比较稳健的lambdaqz=(lambda1+lambda2+lambdazwqj)/3;即使不考虑二阶矩估计,用其它两种估计的平均值作为参数lambd的估计也应是比较稳健的lambdaqz=(lambda1+lambdazwqj)/2;:比较估计分布与经验离散频率分布:,用其它两种估计的平均值作为参数lambd的估计,,即图形的接近程度高一些,但两种分布的差别还是较大。:=238,l=1,Kf=>()N=238,l=1,Kf=>()其中n为数据个数,l为估计参数个数。而Kf为经验离散频率分布函数和拟合分布的差的平方的加权和,近视为KF统计量,自由度为(n-l-1),。:变换原始数据上述分布的各种参数为mnmyycdssyymaxyyminyypzyyp50mumyyylambda1lambda2lambdaxxklambdal23810803309lambdaulambdasxlambdazwqjlambdaqzxitazdddkkkpixitaLxitaUfun138平时柏松分布其中普松分布的一阶矩估计和普松分布的二阶矩估计不一致,这可能是估计不准确的原因。为了消除这个原因,我们采用数据变换的方法解决。对数据yy做变换:myyy=myy-minyy;c=(myyy)/(ssyy**2);d=0;yy=int((myyy+d)*c);(此时变换后的均值为变换前的c倍,而变换后的方差为变换前的c^2倍,令两者相等,得到上述的变换公式,由于取整数函数int(*)有低估现象,能够用d来做小的调整)。用这些数据进行上述同样的分析得到图形如下从图形看出效果很好。=238,l=3,Kf=<()其中n为数据个数,l为估计参数个数。而Kf为经验离散频率分布函数和拟合分布的差的平方的加权和,近视为KF统计量,自由度为(n-l-1),。得到的分布参数为mnmyycdssyymaxyyminyypzyyp50mumyyylambda1238040110lambda2lambdaxxklambdallambdaulambdasxlambdazwqjlambdaqzxitaz4xitadddkkkpiLxitaUfunCLUCLLCL1360平时柏松分布0其中普松分布的一阶矩估计(lambda1=)和普松分布的二阶矩估计(lambda2=)。数据变换方法使得两个估计接近相等。:变换控制图根据变换后的估计分布的控制图,变回
2020年虹桥飞机场出租车数据分析报告. 来自淘豆网m.daumloan.com转载请标明出处.