甘肃政法学院本科课程设计数据仓库与数据挖掘题目基于 k-means 算法的聚类计算机科学学院(系)信息管理与信息系统专业 2011 级本科班学号姓名指导教师成绩完成时间 2013 年12月基于 k-means 算法的聚类研究摘要: 聚类是数据挖掘领域中重要的技术之一, 用于发现数据中未知的分类。聚类分析已经有了很长的研究历史,其重要性已经越来越受到人们的肯定。聚类算法是机器学习、数据挖掘和模式识别等研究方向的重要研究内容之一, 在识别数据对象的内在关系方面, 具有极其重要的作用。聚类主要应用于模式识别中的语音识别、字符识别等, 机器学习中的聚类算法应用于图像分割, 图像处理中, 主要用于数据压缩、信息检索。聚类的另一个主要应用是数据挖掘、时空数据库应用、序列和异常数据分析等。此外,聚类还应用于统计科学,同时,在生物学、地质学、地理学以及市场营销等方面也有着重要的作用。本文是对聚类算法 K-means 的研究。首先介绍了聚类技术的相关概念。其次重点对 K-means 算法进行了分析研究, K-means 算法是一种基于划分的方法, 该算法的优点是简单易行,时间复杂度为 O(n) ,并且适用予处理大规模数据。关键词: 数据挖掘;聚类分析; K-means Cluster Analysis Based on K-means Algorithm Abstract : Clustering is one of the important technologies in the area of data mining, is used to find the classification of the data of the unknown. Clustering analysis has a long history of the study, its importance is more and more people. Clustering algorithms such as machine learning, data mining and pattern recognition research direction is one of the important research content, in terms of identification of the intrinsic relationships between data objects, has the extremely important role. Clustering is mainly used in pattern recognition of speech recognition, character recognition, etc., and machine learning in the clustering algorithm is applied to image segmentation, image processing, it is mainly used for pression, information retrieval. Clustering is another major application of data mining, spatio-
基于k-means算法聚类研究11 来自淘豆网m.daumloan.com转载请标明出处.