个人介绍
姓名:刘云飞 (afeiliu)
爱好:运动(足球),学它)
工作经验:2010年11月加入腾讯,就职于腾讯拍拍安全组,主要负责拍拍网用户安全教育,交易欺诈防范等相关安全运营方面的工作.
整理课件
整理课件
内在有偏的样本
常见名词:
1、总体:是指所要研究对象的全体。它是根据一定研究目的而规定的所要调查对象的全体所组成的集合,组成总体 的各研究对象称之为总体单位。
2、个体:总体中的每一个考察对象。
3、样本:样本是总体的一部分,它是由从总体中按一定程序抽选出来的那部分总体单位所组成的集合。
4、样本的容量:样本中个体的数量叫做样本的容量。
5、抽样框:是指用以代表总体,并从中抽选样本的一个框架,其具体表现形式主要有包括总体全部单位的名册、地图等。抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的影响。
6、抽样比:是指在抽选样本时,所抽取的样本单位数与总体单位数之比。对于抽样调查来说,样本的代表性如何,抽样调查最终推算的估计值真实性如何,首先取决于抽样框的质量。
7、置信度:也称为可靠度,或置信水平、置信系数,即在抽样总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。
8、抽样误差:在抽样调查中,通常以样本作出估计值对总体的某个特征进行估计,当二者不一致时,就会产生误差。因为由样本作出的估计值是随着抽选的样本不同而变化,即使观察完全正确,它和总体指标之间也往往存在差异,这种差异纯粹是抽样引起的,故称之为抽样误差。
9、偏差:所谓偏差,也称为偏误,通常是指在抽样调查中除抽样误差以外,由于各种原因而引起的一些偏差。
10、均方差:在抽样调查估计总体的某个指标时,需要采用一定的抽样方式和选择合适的估计量,当抽样方式与估计量确定后,所有可能样本的估计值与总体指标之间离差平方的均值即为均方差。
整理课件
内在有偏的样本
情景:你是一个被分配到街道某个角落进行调查的人员,有两个看上去符合调查要求——大于40 岁,农民——的人向你走来,一个衣着干净整齐而另一个显得肮脏、粗暴。毫无疑问,你会向后者走去,而遍布城市其他角落的同事也会进行同样的抉择。
内在有偏的样本,与误差的遭遇战:
注意以下几点:
1\随机样本的检验标准是:总体中的每个名字或事物是否具有相同的几率被选进样本?
2\你的样本是否容量足够,具有代表性吗?
3\抽样误差?偏差?不管是设计过程还是执行过程甚至包括设计执行人员的选取都会对结果产生影响.
情景二:你授权调查公司的员工平均薪水,你随机选取了一个部门,作为样本,得出腾讯员工的平均薪水是5800,实际上你选择的部门员工才20几个人,且该部门其中有8个毕业生.
整理课件
精心挑选的平均数
某公司员工工资会计报表
员工一
3000
员工二
3300
员工三
3500
员工四
4000
员工五
3000
员工六
3000
员工七
3800
员工八
4000
员工九
3700
员工十
4200
员工十一
3500
员工十二
3600
员工十三
3000
老板一
50000
老板二
50000
平均数
?
对比下,看看你的答案是哪一种!
向外界发布的平均工资
9700
内部财务报表的平均工资
3600
员工私下聊的平均工资
3000
做一下简单的会计题
整理课件
精心挑选的平均数
注意:只有在当数据处于正态分布时,三种类型的平均数才会落到一点上.
整理课件
没有披露的数据
神奇的牙膏,香皂
神奇的统计学
主要把戏:不充分样本——统计角度的不充分(使用小样本的重要性在于:在大样本的使用中,任何由于机遇产生的差异都是微不足道的;仅仅在进行了大量的实验后,平均数定律才是一种有用的描述并可用来预测。)
次要把戏:只提供商家所希望表达的意思相关数据项
高露洁,比普通牙膏有效防止蛀牙高达23%
舒肤佳, 99%有效杀菌,长达24小保护
整理课件
没有披露的数据
爸爸妈妈的担心
令人忽略的统计学
小圆圆1岁零4个月了,活泼好动,喜欢吃爽歪歪和零食,,在百度了输入”16个宝宝的标准升高体重”得出的结果是:身高80cm,,小圆圆才11公斤,,小宝宝的身体指标只是一个参考,且是有一个区域值的,只要宝宝在范围内都是正常的,结果是爸爸妈妈虚
《统计数据会说谎》 来自淘豆网m.daumloan.com转载请标明出处.