郑州大学
硕士学位论文
决策树分类方法及其在铁路客票营销分析中的应用
姓名:张静
申请学位级别:硕士
专业:计算机软件与理论
指导教师:叶阳东
摘要系统款分炎葵粗孟肥萃谶惨桓霭昕㈦は璋尽——用非平凡的方法从大量数据中发现商用的知识,正是应此要求而迅速发展起塞残至喑碧崛㈥А焓恫纫幌盗幸N取8梅椒ㄏ芾菔视μ方哑庇O治霰客运豹台瑷安接及缎级管理提供了丰富豹决策信惠。随着计算机科学的不断发展,大量的原始数据被不断收集并存储到计算机中,面数援处理能力的低下,造成了尽嚣信息丰富,知识贫乏的现状。数据挖援来的一门科学。数据挖掘包含众多任务,分类是其中一项被广泛应用舱技术。分类经过长麓的发最已产生了众多算法,德其串大部分帮是内存驻留算法,通常假定数据量很小。随著数据库中数据量越来越大,建立高效的、适用于大型数据库铁路中的客票系统蕴含了丰富的数据信息,如何从这海掇的信息中挖掘出有用的知识,是一会亟待研究解决豹阀题。本文将数据挖掘中能分类技术月于铁鼹客票营销分析中的客票分类,形成了一种新的分类方法梅椒ㄕ攵蕴房推钡氖导侍氐悖捎藐的基于文件分割秘定量规则兹决燕树分类冀法对客票数据谶行分析,以达到依攒窖票属黢特征对客蔡发售及列车运营蓊提避行势类及颈涎瓣鞫懿。该方法被瑙予客票分析,得出了能够指导列车营运的非平凡模式和决策信息,实现了分类技术与大规模客票数据库系统捆缝合的一次尝试。椒ㄒ蕴房推笔菸;。蕴房推庇O治鑫D康模攵蕴路客票信息数据量大、属性复杂、域值广等特点,实现了从数据预处理、决策树需要,能够对客票数据进行较为有效的分析和处理,得出指导铁路营运的决策信惴ㄒ跃霾呤鞣掷嗨惴↖的基本思想为基础,用基于文件分割的方法代替原有的基于内存的算法,提高了算法的可规模性,可以处理超大觏模的数据。另外,算法还产童了带有统计信息的定量规则,能够清晰地提供主类的分布情况,为数据分析提供了更为详细的信息。遥遘稀究,蔽镪为分类技术懿发震翎建了薪熬波蠢鹜豢,为其进一步研究奠关键字:数据挖掘,分类,决策树,客票营销分析,定量规则,客运息。定了应用熬础。另~方面,也将数据挖掘的技术用于铁路客浆营销分析,为铁路
甒热强,如。甒琣,.—籖,.,.。。瓵瑆,,甋,,.瑄篋
第一章绪论针对客票数据的特点研制开发了适用予客票挖掘的决策树分类方法鞭论文髓研究背景于是,数据挖搦——由大量数据中,雳菲平凡的方法发现有用的知识,就数据库蕴含大量的信息,可以用来做出各种勰能的商务决策。农数据挖握尽管数据挖掘技术已经窝了很大的发展,并息应用于社会生产的蒜个方面,但是鉴予铁路客票数据的特殊往,一直未能应用劐铁路客桑营销分帮千中。本文并将其盘翅予铁路塞票营销分析,褥出了丰富的决策信息,用于指导裙车营运。下面就论文的研究背景、研究意义以及论文的蹩体结构作一介绍。在数据库技术迅猛发展的今天,人们产生和收集各种类型数据的能力迅速提高,造成数据的大量堆积。其中包括条码在商晶中的广泛使用,商务、科学和行政事务的计算机化,以及由文本和图像扫描平台到卫星遥感系统豹数据收集工其静遴步。魏矫,律必全球信息系统的万维两的流幸予,更是将我们淹没在数据和信息的汪洋太海中。存储数据的爆炸性增长激起了对新技术和自动工具鹃嚣求,以帮助我们将海量数据转换成绩息和酝识。尽管很早就出魏了篱摹的数据统计技术,能够对数据谶行一定的分析,但这远远不够,我们需要更为先避的智ナ莘终て涠院w莛鲜菔鄹薪陡I钊胛予ト胤峙颓妗因此,在商业领域和科学研究领域都迫切要求发展这样的技术,能够从如此海量的数据中抽敬如非平凡模式,找出数据变化的规律和数据之潮的楣互依存关系,使人们能够从宏观的商层次的角度来审视数据,充分发掘数掰的潜力,指导人们的行为,为决策和科学发展提供有力的支持。成了一种自然而迫切的社会需求。正是这种广泛的社会需求引起了人们的关注,导致了数据挖撼研突翘蓬勃野展穗数据挖掘技米的不断进步。数据挖掘任务一般可以分为两类:描述和预测。描述性挖掘刻画数据库中数据的一般特性;预测性挖掇怒在当翦数据上进褥接薮,以送行颓溅。数据携掇主要袁狱下凄能:对概念和类进行描述;利用关联分析发现关联规则;分类和预测;聚类分析;孤立点分橱;演变分撰,攒述行为随时阀变化懿对象的规律或趋势,并对其建模】磁。决繁秘分类旁法及箕在铁路客幕营销分析中韵程疆
粝鸯主要瓣的大型数据疼系统——客鬃营销分稷蓉裂嘲,它是采震全耨戆数攒众多的功能中,分类是其中一项非常重要的任务。分类是这样的过程,它找出绉述并区分数据类或穰念豹横嫠,以矮能够使薅模型预测类标号未知的对象类【俊7掷嗟哪康氖翘岢鲆桓龇掷嗪蚍掷嗄P停媚P湍馨咽菘庵械氖项映射到绘定类剐中瓣菜一个。分类楚数据挖掘审的一令重要问题,匿蠹外的研究人员在数据挖掘、统计分析、机器学习、神经
决策树分类方法及其在铁路客票营销分析中的应用 来自淘豆网m.daumloan.com转载请标明出处.