数据挖掘在通信企业管理系统中的应用.doc数据挖掘在通信企业管理系统中的应用
【摘要】通信企业客户数量多、数据存储量大、响应及时性要求高,其数据仓库对基于大数据的挖掘需求强烈。基于上述需求,提出数据挖掘在应用的方法,用以提高其运营效率。
【关键词】数据挖掘大数据通信企业应用
通信企业具有客户数量多、数据规模大、数据及时性需求高等特点。应用数据挖掘技术对通信企业收集到的数据进行建模可以帮助企业对现有的运维、计费、市场中的运营进行深度研究,得到系统存在的问题、用户支付情况等信息,为企业改善自身系统提供新的支撑。具体来讲,通信企业可以通过数据挖掘技术实现系统故障管理、系统计费管理和用户管理。
一、数据挖掘在故障管理系统中的应用
网络故障管理系统概述
故障管理是通信企业网络管理的重要组成部分,故障管理是否有效直接关系到整个网络的可靠性,其目的是迅速发现和纠正整个网络的告警故障,维护网络的可用性。通常需要对故障时间点附近所有告警进行分析才能够发现故障的根本原因,数据呈现告警数据库巨大、数据具有关联性和告警数据的关联性只能反映系统当前状态等特点。故障管理系统的特点决定了使用关联模型不仅可发现告警数据的关联性还能够高效地更新和维护已经出现的数据和数据间的联系规则。
?稻萃诰蚍椒ǖ挠τ?
重复项增量挖掘
重复项增量挖掘是关联模型应用中的一个基本问题。由于并非每条告警都表示某故障的根本原因,需要对告警数据进行规则处理,将多个告警合并成一个包含更多信息量的告警,以便确定反应故障根本原因的告警,从而对故障进行定位。然而对所有数据进行分析处理数据量过大,导致系统效率低下,因此需要通过设置反映需要监测的告警数据频繁程度的支持门限实现重复项增量挖掘。支持门限增大算法效率会提高,但会减少处理的告警项目;支持门限减少算法执行效率会下降,但可以处理更多的告警项目。因此需要针对用户需要不断调整支持门限,并采用不同算法来对数据进行处理。当需处理的数据为日常事件、常规数据时,可采用CHARM算法,使用混合搜索策略跳过树的多层进行重复项搜索,提高搜索效率;若处理故障性数据时,通常采用BODHI算法,通过数据间的关联和削减,确定关键数据,然后判断系统故障节点[1]。
告警增加时增量挖掘
随着告警数据增加,已有挖掘结果也会受影响,此前所用模型可能不再适用。为保证规则有效性需要及时应对数据更新带来的变化,但若每次都不利用现有结果而重新发现所有数据,将会造成巨大浪费。
本文发现,若每次增加相同数据集,则支持门限越小,性能提高越显著;若支持门限相同,则数据集增加量减少,性能提高越显著。此时可采用PADMAN算法[2],该算法复杂度取决于支持门限以确定的重复项个数,而跟数据量大小关系不大,在支持低门限条件下,算法对稠密数据库性能改善更为显著。从重复数据项中发现关联规则的经典算法是APRIORI规则产生算法[3],其可从重复数据中发现所有满足支持门限和置信门限的强关联规则。
二、数据挖掘在计费管理系统中的应用
计费管理也是通信企业网络管理的重要组成部分,计费管理的有效性直接关系到通信企业计费结算业务是否能够平稳开展。计费管理主要提供账单查询等各种收费报表的查询统计,为企业各种服务决策提供数据支持。随着计费管理越来越多的业
数据挖掘在通信企业管理系统中的应用 来自淘豆网m.daumloan.com转载请标明出处.