第 卷 第 期 年 月 科学技术与工程
12 35 2012 12 Vol. 12 No. 35 Dec. 2012
1671—1815 2012 35-9706-04 Science Technology and Engineering 2012 Sci. Tech. Engrg.
基于语义标注的文本聚类算法研究
王 燕 孙秀英
黄河科技学院现代教育技术中心,郑州
450063
摘 要 为了改变元数据创建还处于手动、半手动的现状,要提高 Web 页元数据的精确度。首先基于语义标注理念,以群体
共享的形式对 Web 页语义信息进行标注。生成过程中利用自动聚类算法,侧重于分析标注者不同特点对提高元数据质量所
起的作用,提出了一种自动生成元数据方案。最后,通过实验证明,元数据结果会因标注者特点的不同而异,并且当标注者影
响超过了临界值会提高元数据的质量。
关键词 元数据 语义标注 自动聚类 自动创建
中图法分类号 TP391. 12 文献标志码 A
信息技术正逐渐改变着人类的思维方式,越来 种基于语义标注的文本聚类算法,充分考虑标注者
越多的人利用互联网搜索信息 购买商品 然而面 不同特点,利用自组织映射算法实现了文本聚类
、 。 。
对海量的网络信息资源,用户往往显得手足无措 最后,通过实验测试标注者个体差异对元数据生成
。
信息过载 资源迷向 等问题层出不穷 原因在 的影响
基于语义标注的文本聚类算法研究 来自淘豆网m.daumloan.com转载请标明出处.