下载此文档

加权关联规则挖掘算法地地研究 及应用.pdf


文档分类:IT计算机 | 页数:约63页 举报非法文档有奖
1/63
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/63 下载此文档
文档列表 文档介绍
天津师范大学硕 1丁学位论文
摘要
数据挖掘能够从大型数据库或数据仓库中提取隐含的、先前未知的、对决策
有潜在价值的知识和规则。关联规则挖掘是数据挖掘中的一个非常重要的研究方
向,用于发现数据库中项之间的相互关系。从是否生成频繁项集的角度,可以将
关联规则挖掘算法分两类: 生成频繁项集的算法和不生成频繁项集的算法,分别
以 A Priori算法和 F P 一grow th 算法为经典代表,但是二者都没有考虑到数据库中
项目的重要性不同。本文重点对项目加权关联规则算法进行了研究,主要工作和
创新之处有以下几部分:
首先, 介绍了数据挖掘和关联规则的相关理论知识, 重点对 A prio ri算法的
基本思想进行了分析和改进,简述了其在 w eb 数据挖掘领域中的应用。
其次,山于不考虑数据库中项目的重要程度,会产生无趣规则,因此为关联
规则引入了丁贞目加权思想,深入研究了几种加权关联规则挖掘算法和模型。分析
出了现存的加权关联规则模型和算法的优缺点,详细阐述了改进算法的思想;
第三,提出一种基于矩阵的加权关联规则的改进算法。通过一次扫描,将关
系数据库存储转换为。一1 矩阵的形式,减少了内存空间的占用; 在对频繁(k 一l)-
项集进行连接运算前进行预剪枝, 并且改进了剪枝策略; 算法不产生候选项集,
而是直接生成频繁项集; 由于引入权值导致非频繁项集的超集可能是频繁的,所
以单独考虑加权频繁 2一项集的生成方式,不会遗漏加权频繁集; 在生成关联规则
时,引入了兴趣度约束。给出算法的伪代码和流程图,通过实例和实验说明了算
法的可行性和优越性。
最后,介绍了个性化推荐流程,将改进算法应用于知识点的个性化推荐领域。
个性化推荐包含离线部分和在线本部分,该算法的优势主要体现在离线部分,节
约了离线产生加权关联规则的时间。通过模拟实验证明了算法的可行性。
关键词: 数据挖掘; 关联规则; A Priori 算法; 加权关联规则; 个性化推荐
天津师范人学硕{ 学位论文
A b s tFa C t
D a ta m in in g e a n a e q u ire s kn o w le d g e a n d ru le s th a t a re im P lie it,u n k n o w n a n d
h a v in g P o te n tia l v a lu e fo r d e e isio n 一m a k in g fro m la rg e d a tab ase s o r d ata w a re h o u se s .
A sso e ia tio n ru le m in in g 15 a v ery im P o rta llt re se a re h fie ld in d a ta m in in g ,w ith th e th e
P u rp o se o f fin d in g th e re la tio n s am o n g ite m s in th e d a tab b a se . F ro m th e sta n d P o in t o f
w h e th e r to g e n e ra te fre q u e n t ite m se ts ,a sso e iatio n ru le m in in g a lg o rith m e a n b e
d iv id e d in to th e a lg o rith m o f g e n e ra tin g fre q u e n t item s a n d n o t g e n era tin g fre q u e n t
ite m s .T h e e la ssie a l a lg o rith m s are A P rio ri A lg o rith m a n d F P 一g ro w th A lg o tith m ,b u t
n e ith er e o n sid e rs th e d if fe re n t im P o r ta n e e o f th e ite m s in th e d a ta b a s e .T h is th e sis
In v e stlg a te S th e a lg o ritllm o f w e ig h te d a sso e ia tio n ru le h e m ain w o rk an d ixin o v a tio n s
o f th is th e sis a re a re a s

加权关联规则挖掘算法地地研究 及应用 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数63
  • 收藏数0 收藏
  • 顶次数0
  • 上传人hytkxy
  • 文件大小0 KB
  • 时间2015-12-25
最近更新