第二章数据的收集
第1页/共21页
§ 数据是怎样得到的?
可从报纸、电视、互联网、年鉴等方面看到各种数据
并且从这些数据可以提取对自己有用的信息。
这些间接得到的(并非自己收集的)数据都是二手数据。
第2页/共21页
§ 数据是怎样得到的?
获得第一手数据要困难得多
某方便面企业每年至少花三四千万元来收集和分析数据
调查其产品及竞争者在市场中的状况、各种类型消费者对其产品的态度、收集各地方的经济交通等信息等等
第3页/共21页
§ 数据是怎样得到的?
他们如同间谍,收集各种情报
他们很舍得在这方面花钱。因为市场信息数据是企业生存所必需的,绝不是可有可无的。
第4页/共21页
§ 数据是怎样得到的?
在自然的未被控制的条件下观测到的数据,称为观测数据(observational data)。
在人工干预和操作情况下收集的数据就称为试验数据(experimental data)。
同学们自己可以举出大量的观测数据和试验数据的例子
第5页/共21页
§ 个体、总体和样本
需要调查北京市民对交通规则的观点;对象是所有市民,
目的是希望知道市民中对该问题的不同看法各自占有的比例
显然,不可能去问所有的北京市民,而只能够问一部分;
并且根据这一部分的观点来理解整个北京市民的总体观点。
第6页/共21页
§ 个体、总体和样本
在这个例子中,单个北京市民的观点称为个体(element)
所有北京市民对这个问题的观点为一个总体(population),总体是包含所有要研究的个体的集合。
第7页/共21页
§ 个体、总体和样本
而调查时问到的那部分市民的观点(也就是部分个体)称为该总体的一个样本(sample),是总体的一部分。
也有可能试图调查所有的人(比如人口普查),那叫做普查(census)。
第8页/共21页
§ 个体、总体和样本
在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样(simple random sampling),
而这样得到的样本则称为随机样本(random sample)。
第9页/共21页
§ 个体、总体和样本
如果总体是一锅八宝粥,随机样本则是充分搅拌后的八宝粥中的任意一勺
该勺中的八宝粥的成分比例应该和整个一锅粥类似
搅拌越充分,样本的代表性也越好
第10页/共21页
数据的收集 来自淘豆网m.daumloan.com转载请标明出处.