数据分析与R语言实现
第二讲
数据可视化
数据可视化的重要性
综合例子
继续上一讲的例子——模拟产生统计专业同学的名单(学号区分),记录数学分析,线性代数,概率统计三科成绩,然后进行一些统计分析。
对x1做直方图分析
绘制直方图函数hist( )
> hist(x$x1)
探索各科成绩的关联关系
散点图绘制函数plot( )
plot(x$x1,x$x2)
列联表分析
列联函数table( ),柱状图绘制函数barplot( )
table(x$x1)
barplot(table(x$x1))
饼图绘制函数pie( )
饼图
箱尾图
1、箱子的上下横线为样本的25%和75%分位数
2、箱子中间的横线为样本的中位数
3、上下延伸的直线称为尾线,尾线的尽头为最高值和最低值
4、异常值
boxplot(x$x1,x$x2,x$x3)
boxplot(x$x1,x$x2,x$x3,horizontal=T)
箱线图
boxplot(x[2:4],col=c("red","green","blue"),notch=T)
星相图
1、每个观测单位的数值表示为一个图形
2、每个图的每个角表示一个变量,字符串类型会标注在图的下方
3、角线的长度表达值的大小
stars(x[c("x1","x2","x3")])
数据分析与R语言实现02 来自淘豆网m.daumloan.com转载请标明出处.