下载此文档

stata统计软件操作.ppt


文档分类:IT计算机 | 页数:约30页 举报非法文档有奖
1/30
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/30 下载此文档
文档列表 文档介绍
STATA统计软件操作
Stata入门
Stata的数据读入
数据库的描述
变量的生成与处理
数据的合并
数据的转换
单变量描述
双变量描述
描述数据的统计量
图形的制作
参数估计:区间估计
假设检验
方差分析
相关分析
线性回归分析
Stata入门
五大功能:
数据管理、统计分析、图形制作、矩阵运算和程序设计。
界面:
Command(命令)、Results(结果)、Review(回顾)、Variables(变量)。
菜单基本功能:
文件(File)、编辑(Edit)、偏好(Prefs,用户界面设置菜单)、数据(Data,数据的基本处理、描述、排序、改变变量、生成新变量、整合数据、拆分数据等)、图表(Graphics)、统计(Statistics数据分析)、使用者(User)、窗口(Window)、帮助(help)
快捷根据图表的基本功能:
Log(记录文件窗口)、Viewer(帮助窗口)、Results(分析结果窗口)、Do-file Editor(编程窗口)、Data Editor(数据编辑窗口)、Data Browse(数据浏览窗口)、Clear-more-Condition(显示更多结果)、Break(不要显示更多结果)。
Stata数据的读入
log文件。
创建文件:log using “文件路径和名称”,其后带append表示在原有文件的基础上增加新内容,其后带replace表示取代原记录文件;
暂停:log off;
再次开始:log on;
关闭:log close。
数据的存储空间:
增加存储空间(set mem 40m)
清空存储空间(clear,相当于drop all)。
Stata数据的读入
数据的读入:
/.txt/.raw/.xls;
读入文件中的部分变量:use a b c using“文件路径和名称”;
读入文件中的部分样本:use “文件路径和名称” in X/Y(X、Y表示个案序号);
读入文件中某些特征的样本:use“文件路径和名称”if 条件句;
数据库的描述
描述数据的基本情况:describe, d
describe, simple:只展示变量名;
describe,short:报告变量总体情况;
describe,detail:输出全部变量的全部信息;
describe a b c:描述部分变量的情况。
变量编码本:
codebook。
codebook+变量名:描述变量特征。
Stata数据类型及特点
与数据类型对应的是数据库中变量的存储类型(storage type):。
字符型:保存格式为str…,省略表示的是字符位数
数值型:保存格式有byte, int, long, float, double。默认格式是float,前三种只保留整数,占空间最大到最小的顺序是double, float, long, int, byte
press为压缩所有变量;
Compress yr*为压缩共同前缀的变量;
Compress a-c为压缩从a到c之间的所有变量。
数据库的描述
描述变量取值的基本命令参数:
inspect。
显示数据:
browse直接进入数据的浏览窗口;
list最好指定变量,否则会输出数据中所有变量的分布。
数据排序:
sort。
例:比较城乡孩子的性别bysort urban: inspect girl或者sort urban然后by urban: inspect girl.
变量的生成与处理
注意事项:
不要使用新变量取代旧变量;
充分了解原始变量的分布以及每个数值代表的含义;
遵循不重不漏;
将原始变量和新变量的取值进行对比,检查是否有误;注意原始变量的缺失值。
使用gen…replace命令生成新变量;
gen…replace if共同使用形成分组变量
recode nv 原变量的取值=新变量的取值*=其他取值(*表示所有其他没有列出的数值),gen(新变量名)
变量的生成与处理
生成分类变量:
egen 新变量命=cut(旧变量名),at(取值的下限)
eg:egen agegrp1=cut(age),at(0,7,13,16,20)
按照变量b的分类生成均值变量:
egen a_mean=mean(a),by (b)
生成一个变量b和c的行均值变量(avg),忽略缺失值:
egen avg=rmean(b c)
生成标准数值:
egen zweight=std(weight)
计算每一年观察的样本,从而了解在每年的调查中,有多少相同的样本(或相同的个体):
gen numobs=count(personid), by(personid year)
数据的合并(纵向)
纵向合并:

stata统计软件操作 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数30
  • 收藏数0 收藏
  • 顶次数0
  • 上传人liwenfei1314
  • 文件大小113 KB
  • 时间2018-06-19