Ethink 数据挖掘特点?数据挖掘是从大型数据集中发现可行信息的过程。数据挖掘使用数学分析来派生存在于数据中的模式和趋势。?ETHINK 大数据挖掘是国内第一家基于大数据和云计算的数据挖掘工具,通过分布式内存弹性计算引擎,解决大数据相关的挖掘问题,比如用户画像、客户流失预警、客户行为分析、收入预测、故障预警、风险分析、互联网用户日志分析、股票交易监测、信用卡欺诈报警、基因序列分析、移动用户离网预测、企业内部员工电子邮件检测、黑客入侵报警、网游外挂识别、热点问题舆情分析、交通流量预测等。? ETHINK 大数据挖掘支持 WEB 在线可视化开发。整个挖掘流程,从数据集成、数据规范,到模型训练、模型评估、模型部署,都可以在线配置,每步运行都可以在控制台上监控信息,控制灵活, 具有高度的动态性。? ETHINK 大数据挖掘操作简单,让你瞬间成为公司顶级大数据分析专家、数据挖掘专家。无论是复杂的统计分析,还是高深的挖掘算法,你都不需要编程,通过界面化配置,轻松完成分析工作。? ETHINK 大数据挖掘采用弹性分布式的数据集,允许在大型集群上执行基于内存的计算。将数据保存在内存中能够极大地提高性能,我们实现的迭代计算方面比 Hadoop 快二十多倍,同时还可以在 5-7 秒的延时内交互式地查询 1TB 的数据集。? ETHINK 大数据挖掘实现了非常丰富的数据接口, 用于从不同的数据源抽取数据,以便进行统一的整合和分析。使用 ETHINK 大数据挖掘,您可以从几乎所有的主流数据库中提取数据,包括关系型数据库如 SQL Server 、 Oracle 、 DB2 、 Informix 、 My SQL 、 Teradata 、 PostgreSQL 等;大数据数据库如 Hadoop 、 Hbase 、 MongoDB 、 Cassandra 、 Imala 等。您也可以非常轻易地导入文档型数据,包括 CSV 、 XML 、 JSON 等。?数据挖掘过程中数据的质量、数量等各种问题使得该过程平均有 75% 以上的时间花费在数据预处理阶段, ETHINK 大数据挖掘平台提供多种数据处理节点,分析人员可以通过拖拉的方式实现数据的预处理,而不需要精通数据库语言。? ETHINK 大数据挖掘集成了 R语言算法,支持分布检验、均值向量与协方差阵的假设检验、方差分析、回归分析、判别分析、聚类分析、多因子分析、线性规划与整数规划、动态规划、不确定型决策和风险型决策等方面的内容。? ETHINK 大数据挖掘支持所有主流的数据挖掘/知识发现算法,如关联规则、决策树、神经网络、支持向量机、 KMeans 、关联规则等。支持所有主流的数据挖掘/知识发现算法,如关联规则、决策树、神经网络、支持向量机、 KMeans 、关联规则等。
大数据挖掘资料 来自淘豆网m.daumloan.com转载请标明出处.