第 27卷第 4期计算机应用与软件 Vol
2010年 puterApplicationsandSoftware
IPSMS:一个网络舆情监控系统的设计与实现
丁杰徐俊刚
(中国科学院研究生院信息科学与工程学院北京 100049)
摘要描述一个网络舆情监控系统 IPSMS(publicsentimentmonitoringsystem)。该系统试图将网络新闻及论坛、BBS上
的帖子依关键词搜索,并依“事件”聚类,让管理者通过阅读事件可以了解正在发生或已经发生的事件,并提供自动持续追踪事件发
展的功能,以协助管理者快速完整且全面地了解事件全貌。系统由网页抓取器、网页解析器及跟踪检测系统三部分组成。由于网络
舆情的特点是数据量巨大,为了提高效率,系统采用了网页清理技术,并且在话题跟踪过程中使用了 kdtree方法。最后,对系统的
未来工作进行了展望。
关键词网络舆情话题跟踪话题检测网页清理 kdtree
IPSMS:PUBLIC
SENTIMENTMONITORINGSYSTEM
DingJie XuJungang
(SchoolofInformationScienceandEngineering,GraduateUniversityofChineseAcademyofSciences,Beijing100049,China)
Abstract Inthispaper,anIPSMS(publicsentimentmonitoringsystem)
news,postsonforumandBBS,ordingtodifferent“event”
readingtheevent,,thesystemprovidesthefunction
prehensivelyapprehending
,htmlparseranddetection&
numerousdata,publicsentimentanalysis,thetechnologiesofwebpagecleansingandkdtreeal
,theprospectforfutureworkofthissystemissetforth.
Keywords publicsentiment Topictracking Topicdetection Webpagecleansing kdtree
对狭小,展现形式单一,响应速度慢,容易错失情报间关联。
0 引言为此,本文提出一种可以帮助管理者更便捷监视网络舆情
的机制,并设计了相应的系统。该系统将相似事件的网页聚集,
舆情是指在一定的社会空间内,围绕中
IPSMS 一个网络舆情监控系统的设计与实现 来自淘豆网m.daumloan.com转载请标明出处.