37%
36%
数据分析与R语言
数据挖掘
■数据挖掘是以查找隐藏在数据中的信息为目的的技术,是应用算法从大型数
据库中提取知识的过程,这些算法确定信息项之间的隐性关系,并且向用户
显示这些关联
数据挖掘思想来源:假设检验,模式识别,人工智能,机器学习。
常见数据挖掘任务∵关联分析,聚类分析,孤立点分析等等
例:啤酒与尿布的故事。
例:《 Science》的文章《科学家摸索出大型数据集内的趋势》
D
怎要8f
种的E/种n
展现层:报表与图形
■老土的报表
月份:D1国国图导出xc
本唐装本唐装用本装用本唐装用本年黑计新本斯装用韦
户〔白】户
户户)户(户)
展现层
■常见的报表
舍
0●
展现层
■一些有趣的图表
鬼宝交菲实时名动
淘宝订单交易
t
展现层
■某条微博的扩散路径
展现层
Mr Android
根据信息图显示,
Android先生的头发有
47%的可能是黑色的
27%
戴眼镜的几率为37%
28%0
有36%的可能是北美
人,30%的可能脸上
36%
长雀斑,71%的时间
穿T恤,62%的人喜
欢穿牛仔裤,工作只
18%b
占了38%,玩游戏却
占了62%,平均每个
月会用掉582MB的数
据流量
a2201
展现层
■ Mr android
62%
展现层
■网站点击“热力图
R
■R的起源
R是S语言的一种实现。S语言是由AT&T贝尔实验室
开发的一种用来进行数据探索、统计分析、作图的解
释型语言。最初S语言的实现版本主要是S-PLUS。S
PLUS是一个商业软件,它基于S语言,并由 Math Soft
公司的统计科学部进一步完善。后来 Auckland大学的
Robertgent|eman和 Ross Ihaka及其他志愿人员开发
了一个R系统。R的使用与S-PLUS有很多类似之处,两
个软件有一定的兼容性。
数据分析与R语言 来自淘豆网m.daumloan.com转载请标明出处.