网络舆情监测系统评价标准随着互联网的快速增长,网络舆情监测软件及其服务市场也迅速地发展起来, 保守地估计, 在中国大陆地区这个市场的总量已经逼近 10 亿元人民币规模。市场参与者主要包括四种类型的公司:第一类是拥有网络信息搜索或( 中文) 文字信息处理等相关技术的软件公司; 第二类是公关、广告公司, 这类公司是在传统媒体监测业务基础上发展出网络新媒体监测业务;第三类是网络营销服务公司,近几年这类公司增长迅猛, 网络社会化媒体的飞速发展是其发展的催化剂; 第四类是依托传统媒体延伸出的增值服务。随着网络的发展, 不少传统媒体也开始“触网”, 并逐步发展出针对网络媒体的新业务, 而网络舆情监测是其中的一个方面。例如, 人民网舆情监测室。除了以上四类公司之外, 还有一类进行网络舆情监测业务的参与者, 他们是主管部门或行业机构所属的网络舆情监测机构, 但严格意义上讲, 此类机构和参与完全市场竞争的公司是不同的,因此,单独另归为一类。社会化网络媒体的兴起,正在改变传统的信息传播机制。网络传播具有匿名性、速度快、范围大、持续力强、传播渠道多元化、传播效果可测量等特点。一条负面信息从出现到形成舆论热点的周期, 从原来的 24 小时(传统新闻媒体比较典型的更新周期)缩短到现在的 4 小时( 微博热点话题达到第一个传播峰值比较典型的时间周期)。如果不能在这 4 小时内做出解释、反馈、制定应对策略, 就可能出现舆论一边倒的局面, 甚至可能发生极具品牌杀伤力的公共危机。由此, 也就有了网络舆情监测响应“黄金 4 小时”的说法。做出及时、准确应对的前提是,要能够在第一时间了解网络舆情的内容、发生源、关键传播途径等相关信息数据。由此, 对于网络舆情监测软件的性能提出相应要求。如何来评价网络舆情监测软件(系统)的性能呢?个人认为主要着眼于以下三个方面。评价标准之一:对网络内容监测的准确性。对于内容的判断是一个关键技术,目前的监测系统还不能做到对内容信息的完全自动判断和处理, 在不能保证内容识别百分之百准确率的情况下, 往往需要对监测分析的中间产物或不能识别的信息进行一定程度的人工校验和清洗。中文信息在处理上具有一定特殊性和技术难点。英文每个单词之间用空格或标点符号进行分隔, 与英文不同, 中文字之间没有空格, 由字组成词存在多种可能情况,中文分词是识别的一个难点。分词难点:一是分词的歧义识别,歧义是指同样的一句话,可能有两种或者更多的切分方法。主要有“交叉歧义”、“组合歧义”、“真歧义”( 相关定义参见附录) 三类情形。“真歧义”必须要联系上下文才能够确定在文中的具体涵义; 二是新词识别, 随着时代的发展, 中文新词不断涌现, 如果没有被收录而要进行自动识别是非常困难的。与之相似的还有专业术语、名称(包括,人名、商标、简称、机构名、缩略语等) 等的识别问题。新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。在分词基础上,中文内容监测还需要对信息自动进行聚类、情感分析、提取摘要, 特别是自动根据上下文内容判断情感倾向与危机度、区分正负面。而这正是网络舆情监测的核心工作之一。为了提高内容识别的准确性,大部分网络舆情监测系统采取了专业化发展的策略, 通过面向特定领域的知识、经验和基础数据的积累与不断更新, 逐步建立起舆情监测系统在特定领域内的服务特长和功能优势。由此, 也就有了
网络舆情监测系统评价标准 来自淘豆网m.daumloan.com转载请标明出处.