下载此文档

关联规则并行算法在医药销售系统中的应用.pdf


文档分类:IT计算机 | 页数:约47页 举报非法文档有奖
1/47
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/47 下载此文档
文档列表 文档介绍
重庆大学
硕士学位论文
关联规则并行算法在医药销售系统中的应用
姓名:刘颖
申请学位级别:硕士
专业:计算机系统结构
指导教师:熊忠阳
20040508
要摘技术成了商业智能的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注,如何提高数据挖掘的效率成为学术界热门的研究课题。本文主要针对关联规则发现,在商业销售行为领域方面的应用研究。等。作者对现有的关联规则算法进行了分析,在经典的惴ɑ∩希岢了并行—惴ǎ霉淌褂靡恢痔厥獾氖萁峁梗杂诿扛鱿罴锹包含项集中项的事务的疍,使得找出所有频繁罴恍枇酱问菘馍琛J笛证明这种新的并行算法能大大提高收敛速度,得到优于一般并行算法的加速比。此并行算法实现简单有效,能更好地应用于现实问题。的模型上选用了/P汀K惴ú⑿谢绞讲捎昧私盗肥萜骄峙涞并且详细的讨论了不同结点机数时,挖掘结果的纵向对比,验证了算法的正确性关键词;关联规则,算法,萃诰颍⑿兴惴数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘先验的惴ㄊ且恢肿钣杏跋斓耐诰虿级亓9嬖蚱捣毕罴乃惴ǎ但是惴ㄒ灿衅涿飨缘娜毕荩葱枰6啻沃馗瓷杞灰资菘狻⑿什桓本文选用通过商用网络连接起来的机,以及并行虚拟机蚖操作系统,共同构成了一个机群系统作为并行计算平台。在并行程序各节点机的数据并行方式。最后,本文从实用性的角度介绍了关联规则挖掘在商业分析领域方面的应用。和准确性等。最后对挖掘结果的关联规则进行了商业分析,取得了令人满意的效果。证明了此算法在该医药公司销售数据集中具有局部实用性。重庆大学硕士学位论文中文摘要
,,./..瓾瑂琹—.甌甌瓵.:珺狝,
绪论论文选题及研究意义技术——数据挖掘府和科学等领域的数据库内积累了大量历史数据,激增的数据背后隐藏着许多重要的信息,然而过去由于缺乏挖掘数据背后隐藏知识的手段,导致了“数据丰富,能够对数据进行更高层次的分析,以便更好地理解和利用这些数据背后所包含的,阌υ硕耍饫锼傅摹爸J丁本褪数据挖掘技术是面向数据库系统建立的对大型数据库进行更为抽象的、深层次的、二次开发的一项实用性很强的技术,同时数据挖掘也是一门很广义的交叉学可视化等学科领域汲取营养。简单地说,数据挖掘就是从大量的数据中提取或“挖掘”出知识口】。一种比较公认的技术定义是,数据挖掘量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的研究已经和数据仓库蚴菁结合起来,数据仓库蚴菁的出现为数据挖掘技术提供了新的应用领域,也对数据挖掘技术提供了有利的支撑。数据仓库蚴菁把传统数据库中大量的历史数据重新提取,生成一个集数据集市瓿闪耸莸氖占⒓伞⒋娲ⅰ⒐芾淼裙ぷ鳎J萃诰蚬烫峁了规范的、海量的数据,使得数据挖掘能够能专注于知识的发现。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,所发现的知识最常见的有以下五类:广义知识、关联知识⒎掷嘀其中,数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。它反映一个事件和其他事件之间依赖或关联的规律,如果两项或多项属性之间存在关联,那么其中~项的属性值就可以依据其他属性值进行预测。关联可分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。本文主要针随着数据库技术的成熟和数据库管理系统的广泛应用,人们已经在商业、政但信息贫乏”的现象川,即所谓“数据爆炸”。面对浩淼无际的数据海洋,人们希望信息,从数据库中发现知识数据中隐含的信息。科,我们必须从人工智能、统计学、机器学习、知识库系统、高性能计算和数据就是从大的、人们事先不知道的、但又是潜在有用的信息和知识的过程D壳笆萃诰中的、面向主题组织的、随时间变化的、内容相对稳定的数据集合。数据仓库识⒃げ庑椭J推ú钚椭J。,及其核心重庆大学硕士学位论文髀
国内外研究现状综述对关联规则作为数据挖掘的研究对象,在商业行为趋势预测方面的实用性应用研最为著名的关联规则发现方法是瓵提出的惴ā】。根据其思想,关联规则的发现可分为两步:第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;第二步是从频繁项目集中构造可信算法的核心,也是计算量最大的部分。由于常用的关联规则挖掘串行算法,如猤榷即嬖谝桓龉同的局限性:当挖掘数据量很大的时候,算法的可用性和效率大大降低。因此过大的距离。这一方面是因为实验数据脱离了数据库或数据仓库的环境,因此它是为串行算法在面对海量数据集时效率非常降下,而现实数据都有非常庞大的历史本论文是在最经典的关联规则挖掘算法:惴ǖ幕∩隙云浣胁⑿化,提出了数据划分并行援索策略,给出了并行算法。此策略使用一种特

关联规则并行算法在医药销售系统中的应用 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数47
  • 收藏数0 收藏
  • 顶次数0
  • 上传人779277932
  • 文件大小0 KB
  • 时间2011-07-22
最近更新