水平加权关联规则挖掘算法的研究
摘要
关联规则挖掘是数据挖掘领域中一个非常重要的研究课题。许多的关联规则
挖掘研究都是把数据库中的各个项目假设为具有相同的重要性。但在某些研究和
应用领域,不同的项目在用户看来应该具有不同的重要性,所以也应该有不同的
权值。论文的主要工作如下:
针对一类水平加权关联规则挖掘问题,本文提出了 3 种不同的算法:直接法、
重排序法和 Fp-树法。理论分析和实验结果表明 Fp-树法具有最好的性能,而重
排序法生成的候选集最少。在挖掘大数据库时,重排序法的性能也要好于
New_Apriori 法。文章还讨论了水平加权关联规则挖掘算法运用在项目约束关联
规则挖掘中的方法。
传统水平加权关联规则挖掘中,项目都是属于同一个类。在实际运用中经常
会对项目分类,而在项目集包含的项目的权值不变的情况下,项目集包含的类越
多,则这个项目集越有意义。针对这类问题,本文提出了分类加权关联规则挖掘
问题。为了解决这类问题,本文提出了两种对项目的重排序方式:按权值重排序
和按类别重排序。以及在这 2 种重排序方式的基础上提出的 2 种算法:重排序
Apriori 法和重排序 Fp-树法。实验结果表明重排序 Fp-树法性能会比重排序
Apriori 法有更高的性能。而算法基于按类别重排序也会比基于按权值重排序的
算法有更好的性能。
面向对象的基于效用度的关联规则挖掘算法(OOA 挖掘)是要挖掘出针对
特定目标的,并满足支持度、置信度和效用度限制的规则。本文提出了将
Disjunctive-free 模式算法(DFree 算法)应用于 OOA 挖掘的方法。实验结果表
明,在数据相关性较强的情况下,基于 DFree 算法的 OOA 挖掘性能会远远好于
基于 Apriori 算法的 OOA 挖掘。
关键字:数据挖掘,关联规则,水平加权,分类加权,效用度
I
Algorithms for Mining Horizontally Weighted
Association Rules
Abstract
Association rule mining is an important problem in data mining. Many
association rule mining methods make no difference in item’s importance. However,
in some real applications, users often attach different importance to different items, so
items should have different weights. The main contributions of this paper are as
follows:
We present three different algorithms, Direct algorithm, Reordered algorithm and
Fp-tree based algorithm, for horizontally weighted association rule mining problem.
Theoretical analysis and experimental results show that the Fp-tree based algorithm is
the most efficient one and the Reordered algorithm generates the least candidate sets.
The Reorder algorithm is more efficient than the New_Apriori algorithm when mining
large databases. Furthermore, we discuss how th
水平加权关联规则挖掘算法的研究 来自淘豆网m.daumloan.com转载请标明出处.