第 卷第 期 计 算 技 术 与 自 动 化 ...
年 月 .
文章编号 :一~
基 于 自 动 编 码 机 的 短 文 本 聚 类 方 法
黄健 种”,邓玫玲
.广东东华发思特软件有 限公 司,广东 珠 海 ;
.珠海市人 民医院 ,广东 珠海
摘 要 :一种基 于文本 向量化 的短 文本聚 类方法。该方法以词向量作 为基本特征 ,使 用基 于 的
自动编码 机 ,对表征 文本 的词 向量进行压 缩编码 ,从 而将文 本不 定长的词 向量特征 统一提 取 为统一输 入长
度 的文本特征 向量。这 些文本特征 向量的聚类结果即 为短文本 的聚 类结 果。对这 一 方法使 用带标 注 的数
据 集进行 了测试,使用基尼非纯度作为指标衡量该方 法的聚类效果与人 工聚类 的拟 合度 ;同时,使 用聚 类 中
基于lstm自动编码机的短文本聚类方法 来自淘豆网m.daumloan.com转载请标明出处.