.
实训:R语言数据分析
『实训目的〗
了解Python基本编程语法,掌握Python进行数据载入、预处理、分析和可 视化的方法。
〖实训内容与步骤〗
下面,我们通过一些具体的例子,来练习如何利用 R语言对数据进行不同类
型的分析。
有时我们的数据看起来杂乱无章,但其内部蕴藏着某种规律,只是这些规律 可能被一些噪声所扰动,因此无法直观地被发现。为了发现这种规律,我们首先 希望知道数据的概况。一般来说,我们关注数据的两类特征:集中趋势特征和离 散趋势特征。
(1)集中趋势分析
所谓集中趋势分析,是指通过一些统计指标来检验数据集中在哪些数值上, 具体的指标有:平均数、中位数、分位数。在 R语言中,我们可以这样进行集中 趋势的分析:
① 平均数:
* mea n(data$九至十月份降雨量)
[1] 1129
② 中位数:
* mea n(data$九至十月份降雨量)
[1] 1129
③ 分位数:
计算分位数之前,我们需要确定我们关心的分位点,如果我们希望从0到100% 每20%计算一个分位数,贝
* qua ntile(data$ 九至十月份降雨量 ,probs = seq(0, 1, ))
0% 20% 40% 60% 80% 100%
856 1046 1109 1157 1196 1387
我们也可以直接计算“五数”,即0%、25%、50%、75%和100%的分位数量:
* five num(data$ 九至十月份降雨量 )
[1] 856 1053 1139 1182 1387
R语言数据分析 来自淘豆网m.daumloan.com转载请标明出处.