基于音码相似度的拼音模糊查询算法
2008年第8期
计算机与现代化
JISUANJIYUXIANDAIHUA总第156期
文章编号:1006-2475(2008)08-0018-03
基于音码相似度的拼音模糊查询算法
阎红灿,张淑芬,谷建涛,阎少宏
(河北理工大学理学院,河北唐山063009)
摘要:论述了拼音模糊检索技术在信息管理和网络信息搜索系统中的必要性,描述了基于音码相似度的语言模糊查询算法
及实现同音字和近音字检索算法,,在获得同音字数据库基础上,提出
了基于音码相似度阈值的模糊查询算法,给出了通过拼音数据库实现中文全拼和首字母简拼检索数据库字段的实现方案,
从查全率和查准率两个方面对算法的检索效果进行了评价,同时分析了音码相似度阈值对查全率和查准率的影响.
关键词:拼音字典;音码相似度;语音模糊查询;同音字
中图分类号..Teal1文献标识码:A
AnArithmeticofSpeechFuzzyQueryBasedonSpellingSimilarity
YANHong-can,ZHANGShu-fen,GUJian-tao,YANShao-hong
(CollegeofSciences,HebeiPolytechnicUniversity,Tangshan063009,China)
Abstract:Thispaperdiscussesthenecessaryofapplyingspeechfuzzyquerytechniquetoinformationmanagementsystemand
Webinformationsearchsystem,describesthespeechfuzzyqueryarithmeticandthemethodofrealizinghomophoneorsimilar
soundwordsquery,thistechniqueplaysall—rightroleininformationretrieval,andwithexamples,onthebasesofobtaininghom-
ophonewordsdatabase,siresthewayofachievingfullspellingorthefirstcharacterofChinesewords,andfurthermore,bythe
rateoffullqueryandexactquery,evaluatesthequeryeffectofthisarithmetic,ime,analysestheinfluenceofspell—
ingsimilaritycliqueontherateoffullqueryandexactquery.
Keywords:spellingdictionary;spellingsimilarity;speechfuzzyquery;homophonewords
0引言
技术的发展,查
文信息的查询,一般都是通过对字符进行比较,判断
等方法来实现的,因此易于实现精确的汉字信息查
询,即使模糊查询也只是对关键词的重新排列检索,
没有实现真正意义的汉字模糊查
基于音码相似度的拼音模糊查询算法 来自淘豆网m.daumloan.com转载请标明出处.