数据挖掘与分析心得体会
正如柏拉图所说:须要是独创之母。随着信息时代的步伐不断迈进,大量数据日积月累。我们迫切须要一种工具来满意从数据中发觉学问的需求!而数据挖掘便应运而生了。正如书中所说:数提出一类或几类可能的模型,然后通过进一步的分析从中选择必须的模型。
3、推断分析:通常运用数理统计方法对所定模型或估计的牢靠程度和准确程度作出推断。
数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所探究对象的内在规律。在管用中,数据分析可协助人们作出判定,以便采纳适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后效劳和最终处置的各
个过程都须要适当运用数据分析过程,以提升有效性。
由上可见,数据挖掘和数据分析虽然概念上层次清楚,作用上分工明确〔数据分析主要以上数理统计为主,数据挖掘主要是挖掘算法为主〕。但很明显的是,数据挖掘必需借助数据分析的有关方法来挖掘出有效的,对目标应用有意义的模式和学问。或者可以说:数据挖掘也可以是数据分析的一种!
在这样一个信息快速膨胀的时代,数据挖掘和分析都与大量数据打交道。两者都离不开一种80年头后期兴起的一种高级数据分析技术:数据仓库和联机分析处理。
3、数据仓库
数据仓库是一个从多个数据源收集的信息存储库,存放在相同的的模式下,并且通常驻留在单个站点上。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。为便于决策,数据仓库中的数据围绕主题组织。数据存储从历史的角度供应信息,并且通常是汇总的。数据仓库供应一些数据分析实力,称作联机分析处理〔OLAP〕。
数据仓库有以下四种关键特征:
面对主题的:数据仓库围绕一些重要主题,如顾客、供给商、产品、和销售组织。数据仓库关注决策者的数据建模与分析,而不是单位的日常操作和事务处理。因此,数据仓库通常解除对于决策无用的数据,供应特定主题的简明视图。
集成的:通常,构造数据仓库是将多个异构数据源,运用数据清理和数据集成技术,确保命名约定,编码构造,属性度量等的相同性。
时变的:数据存储从历史的角度供应信息。数据仓库中的关键构造都隐式或显式地包含时间元素。
非易失的:数据仓库总是物理地分别存放数据,这些数据源于操作环境下的应用数据。由于这种分别,数据仓库不须要事务处理、复原和并发限制机制。通常,它只须要两种数据访问操作:数据的初始扮装入和数据访问。
4、分类及算法
分类是一种重要的数据分析形式,它提取刻画重要数
数据挖掘与分析心得体会 来自淘豆网m.daumloan.com转载请标明出处.