下载此文档

统计与词典相结合的领域自适应中文分词 张梅山.docx


文档分类:办公文档 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
统计与词典相结合的领域自适应中文分词_张梅山卷年第月!第!"期中文信息学报!CDE8(FG!D,)’H(IJI!!H(,D8KFLHD(!A8D)IJJH(M!#$!%K.-B!#$!文章编号"$##%>##==#!#$!$#!>###&>#*统计与词典相结合的领域自适应中文分词张梅山邓知龙车万翔刘挺社会计算与信息检索研究中心黑龙江哈尔滨!"哈尔滨工业大学计算机学院!!!%!摘#!!相比分词训练语料$要基于统计的中文分词方法由于训练语料领域的限制导致其领域自适应性能力较差$*###$领域词典的获取要容易许多而且能为分词提供丰富的领域信息该文通过将词典信息以特征的方式融入到统计#)8,$%!分词模型该文使用!%域自适应能力%当测试领域和训练领域相同时分词的,>/-0值提升了当测试领域和训练领域不同时!分词的"值提升了"e!!e&,>/-0关键词中文分词%"F中图分类号)8,文献标识码0!;!!!3!!!!!,G<1212&*4*16*1847(,-)742-518*1,24/.,/5,G412’-4*1,2,.#!+12)6)!H,/-!&)0G)2*4*1,2![’F(M!******@.5!SI(M![***@4325Q!)’I!:.!GHE!L45Q"!8090.-T@!)0510-!P2-!!)2/RZ145Q!.5O!H5P2-/.1425!801-40\.3’.-;45!H59141Z10!2P!******@5232QV!’.-;45!’04325Q^!$*###$!)***@45.$’<6*/48*M050-.!/******@2O9!P2-!)***@45090!:2-O!J0Q/!O25X1!***@.\0!Q22O!O2/.45!..;4341V!2a45Q12!******@0!90TR4P4T!1-.4545Q!T2-RZ9BH5!R-.T14T0!O2/.45!O4T1425.-409!.-0!/2-0!!.******@40\0O!******@.5!***@Z/.53V!.!T2-RZ9!.5O!41!!R3051V!2P!O2/.45!45P2-/.1425B:0!R-2R290!.5!.RR-@!******@4T@!4510Q-.109O4T1425.-V45!P2-/.1425!4512!!/2O0394B0B)8,!/2O03!45!******@49!-12!-?0!O2/.45!.!P2-!)***@45090:2-O!J0Q/-4/!-09Z319!******@2a!******@.1!2Z-!.RR-@!***@.\0!Q22O!O2/.45!.:***@05!******@0!1091!T2-RZ949!!12!******@0!O2/.45!2P!1-.4545Q!T2-RZ9!******@0!,>/-0!\.3Z0!45T-!!e&******@05!1091!T2-RZ9!49!45!.O4!PP0-051O2/.45!2P!******@0!1-.4545Q!T2-RZ9!******@0!,/0>.9Z-0!\.3Z0!45T-!"eB=)>,/-6")***@45090a2-&)8,&O

统计与词典相结合的领域自适应中文分词 张梅山 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人cby201601
  • 文件大小115 KB
  • 时间2020-09-13