下载此文档

统计学复习.doc


文档分类:高等教育 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
统计是收集、分析、表述、解释数据的科学;统计方法:1、描述统计:研究数据收集、整理和描述的统计学分支;研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法。2、推断统计:利用样本数据推断总体数据。(参数估计和假设检验)研究如何科学地由样本去推断总体;如何科学地从总体抽出样本;怎样控制样本对总体的随机误差。统计数据的分类,按照计量尺度、收集方法和时间状况按计量尺度:(1)分类数据:只能归于某一类别的非数字型数据对事物进行分类的结果,数据表现为类别,用文字来表述例如,人口按性别分为男、女两类(2)顺序数据:只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等(3)数值型数据:按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm按收集方法:(1)观测的数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据(2)试验的数据(experimentaldata)在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据按时间状况:(1)截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2005年我国各地区的国内生产总值数据(2)时间序列数据(timeseriesdata)在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据参数与统计量的联系与区别参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值(m)、标准差(s)、总体比例(p)等总体参数通常用希腊字母表示统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(`x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示系统的内部数据、外部数据指的是什么系统外部的数据:(1)统计部门和政府部门公布的有关资料,如各类统计年鉴(2)各类经济信息中心、信息咨询机构、专业调查机构等提供的数据(3)各类专业期刊、报纸、书籍所提供的资料(4)各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料(5)从互联网或图书馆查阅到的相关资料系统内部的数据:(1)业务资料,如与业务经营活动有关的各种单据,记录(2)经营活动过程中的各种统计报表(3)各种财务,会计核算和分析资料等4、二手数据审核的主要内容:适用性和时效性评估:谁搜集的;为什么搜集的;怎样搜集的;什么时候搜集的。统计数据的来源有哪些?数据的间接来源:系统外部和系统内部数据的直接来源(原始数据):调查数据和实验数据概率抽样和非概率抽样的方法有哪些?两者的不同点在哪?概率抽样(简单随机抽样、整群抽样、多阶段抽样、分层抽样和系统抽样)非概率抽样(方便抽样、自愿抽样、配额抽样、判断抽样、滚雪球抽样)概率抽样(1)依据随机原则抽选样本(2)样本统计量的理论分布存在(3)可根据调查的结果推断总体非概率抽样(1)不是依据随机原则抽选样本(2)样本统计量的分布是不确定的(3)无法使用样本的结果推断总体非抽样误差有哪些?有抽样框误差、回答误差、无回答误差、调查员误差、测量误差抽样误差的原因是什么?影响抽样误差大小的因素是什么?由于抽样的随机性所带来的误差所有样本可能的结果与总体真值之间的平均性差异影响抽样误差的大小的因素:样本量的大小和总体的变异性抽样误差可计算和控制。如何确定组距,如何对数据进行分组?什么是茎叶图?树茎和树叶分别表示什么?箱线图有哪5个特征值表示?最小值、下四分位数、中位数、上四分位数、最大值主要展示分组的数值型数据的分布(错的)。11、集中趋势的度量指标有哪些?各自的计算公式、特点及相互比较(适合描述哪种类型的数据、是否受极端值影响等)、平均数的性质众数(mode):一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据中位数(median):排序后处于中间位置上的值不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据位置确定:先排序后计算。四分位数(quartile):排序后处于25%和75%位置上的值不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据平均数:也称为均值,一组数据相加后除以数据的个数得到的结果集中趋势的最常用测度值

统计学复习 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人cjrl214
  • 文件大小38 KB
  • 时间2019-02-13