大数据、数据挖掘、数据分析资料.doc与数据挖掘有关或有帮助的R包和函数的集合
2015-01-19大数据大数据
hzdashuju大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价 值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
与数据挖掘有关或者有帮助的R包和函数的集合。
1、 聚类
常用的包:fpc, cluster, pvclust, mclust
基于划分的 方法:kmeans,pam,pamk,clara
基于层次的方法:hclust,pvclust,agnes,diana
基于模型的方法:mclust
基于密度的方法:dbscan
基于画图的方法:plotcluster,
基于验证的方法:
2、 分类
常用的包:
rpart, party, randomForest, rpartOrdinal, tree, marginTree,
maptree, survival
决策树:rpart,ctree
随机森林:cforest, random Forest
回归,Logistic 回归,Poisson 回归:glm,predict,residuals
生存分析:survfit,survdiff,coxph
3、 关联规则与频繁项集
常用的包:
arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则
DRM:回归和分类数据的重复关联模型
APRIORI 算法,广度 RST 算法:
ECLAT算法:采用等价类,RST深度搜索和集合的交集:eclat
4、 序列模式
常用的包:arulesSequences
SPADE 算法:cSPADE
5、 时间序列
常用的包:timsac
时间序列构建函数:ts
成分分解:decomp,decompose,stl,tsr
6、 统计
常用的包:
方差分析:aov,anova
密度分析:density
假设检验:,,anova,aov
线性混合模型:Ime
主成分分析和因子分析:princomp
7、 图表
条形图:barplot
饼图:pie
散点 ffl:dotchart
直方图:hist
密度图:densityplot
蜡烛图,箱形图boxplot
QQ(quanti
大数据、数据挖掘、数据分析资料 来自淘豆网m.daumloan.com转载请标明出处.