SOM 算法研究与应用 1引言聚类分析在数据挖掘研究中占有重要的位置,聚类是一个将数据集划分为若干类的过程,并使得同一个类内的数据对象具有较高的相似度而不同类的数据对象之间的区别较大。聚类分析属于一种无教师监督的学习方法,其基本的指导思想是最大程度地实现类中对象相似度最大类间对象相似度最小。本文介绍了一种基于自组织映射网络的数据聚类方法该方法。分别从其研究背景和算法以及算法的设计与实现进行说明。脑科学的研究表明,人类大脑皮层中的细胞群存在着广泛地自组织现象。处于不同区域的神经元具有不同的功能,它们具有不同特征的输入信息模式,对不同感官输入模式的输入信号具有敏感性,从而形成大脑中各种不同的感知路径。并且这种神经元所具有的特性不是完全来自生物遗传,而是很大程度上依赖于后天的学习和训练。而本文所介绍的自组织特征映射网络( SOM )就是根据这种理论而提出的。自组织映射(anizingFeatureMaps , SOM) 网络也称为 Kohonen 网络,该模型是由芬兰的赫尔辛基大学神经网络专家 TeuvoKohonen 于1981 年提出,现在已成为应用最为广泛的自组织神经网络方法。 TeuvoKohonen 认为处于空间中不同区域的神经元有不同的分工, 当一个神经网络接受外界输入模式时,将会分为不同的反应区域,各区域对输入模式具有不同的响应特征。这种网络模拟大脑神经系统自组织特征映射的功能。它是一种竞争型神经网络,采用无监督学习算法进行网络训练,此网络广泛地应用于样本分类、排序和样本检测等方面。 2 SOM 算法 SOM 算法是由 T。 Kohonen 于1982 年提出来的一种基于竞争学习的单层神经网络模型。它在对数据进行矢量量化的同时还能实现对数据的非线性降维映射,该映射具有拓扑保持的优良特性,从而使 SOM 算法成为一种常用的聚类和可视化工具。在 SOM 算法中, 作为数据代表的神经元被固定在一个低维常规网格上,采用邻域学习方式最终可达到神经元在该网格上的拓扑有序。从网络结构上来说, SOM 网络最大的特点是神经元被放置在一维、二维或者更高维的网格节点上。如图1就是最普遍的自组织特征映射二维网格模型。图1 二维 SOM 网格模型 SOM 网络的一个典型特性就是可以在一维或二维的处理单元阵列上,形成输入信号的特征拓扑分布,因此 SOM 网络具有抽取输入信号模式特征的能力。 SOM 网络一般只包含有一维阵列和二维阵列,但也可以推广到多维处理单元阵列中去。下面只讨论应用较多的二维阵列。输入层是一维的神经元,具有 N个节点,竞争层的神经元处于二维平面网格节点上, 构成一个二维节点矩阵,共有 M个节点。输入层与竞争层的神经元之间都通过连接权值进行连接,竞争层临近的节点之间也存在着局部的互联。 SOM 网络中具有两种类型的权值, 一种是神经元对外部输入的连接权值,另一种是神经元之间的互连权值,它的大小控制着神经元之间相互作用的强弱。在 SOM 网络中,竞争层又是输出层。 SOM 网络通过引入网格形成了自组织特征映射的输出空间,并且在各个神经元之间建立了拓扑连接关系。神经元之间的联系是由它们在网格上的位置所决定的,这种联系模拟了人脑中的神经元之间的侧抑制功能,成为网络实现竞争的基础。 3算法的设计层次型结构,具有竞争层。典型结构:输入层,竞争层。如图 2所示。竞
SOM算法研究与应用 来自淘豆网m.daumloan.com转载请标明出处.