面向服务数据挖掘关键技术与研究.pdf


文档分类:IT计算机 | 页数:约118页 举报非法文档有奖
1/118
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/118
文档列表 文档介绍
摘要
解决大规模分布异构数据挖掘问题,需要一种便于资源集成、提供高质量数据挖
掘服务,并具有较高安全性和隐私保护性的框架模型。面向服务的体系结构
,、本体、服务等新技术将为数据挖掘系统的开发
提供更强大的技术支持。根据分布异构环境下数据挖掘的特点,综合利用、本体、
服务等新技术,遵循以用户为中心的理念,提出了一种开放式的面向服务的数据
挖掘系统框架――。该框架将数据挖掘的算法封装成服务,利用异构数据
集成本体和隐私保护策略本体实现应用域的隐私保护语义数据集成,利用以用户为中
心的数据挖掘本体和数据挖掘服务质量评价本体帮助用户动态选择适用且高质量的
数据挖掘服务,可在分布环境下为不同领域多层次用户提供高可用性、高性能、
高质量、安全的数据挖掘服务。
对于分布异构的数据挖掘,异构数据集成是数据预处理很关键的第一步。数据集
成的模型需要有效的解决数据异构性、完整性、权限控制、集成范围限定等问题。在
分析现有的数据仓库方式、中间件集成、基于本体的数据集成方法优缺点的基础上,
借鉴已有的语义数据集成和隐私保护数据挖掘的研究成果,提出了一个基于智能体和
本体的隐私保护语义数据集成模型,以解决应用域隐私保护数据挖掘数据预处理的问
题。定义了隐私保护数据挖掘本体,数据集成采用全局视图( )和局部视图()
相结合的混合本体集成方法,隐私保护策略集成采用单本体的方法,同时利用模式模
糊化和角色模糊化,以提高模型的隐私保护性。
数据挖掘服务是涉及数据、计算、挖掘知识的复杂服务应用,用户需要具备非常
全面的专业知识才能正确使用。现有的以系统为中心的设计中,数据挖掘解决方案特
别重视算法和系统工程,而没有首先探讨最终用户将如何方便地使用新的数据挖掘技
术,使系统难于操作和使用。有的系统利用数据挖掘本体和预测执行时间的方法来帮
助用户选择正确并且高质量的数据挖掘服务,但是数据挖掘本体只是对数据挖掘的方
法进行枚举,无法保证服务的质量。在分析和总结了前人对于数据挖掘技术和系统研
究成果的基础上,结合数据挖掘应用的领域知识,遵循以用户为中心的设计理念,提
出了以用户为中心的数据挖掘本体,一方面根据数据挖掘功能和挖掘对象来组织数据
挖掘算法,另一方面根据应用领域知识为用户提供有效的数据挖掘应用解决方案,帮
助不同领域多层次用户方便选择数据挖掘服务。此外还进一步讨论了基于本体描述语
言( )的数据挖掘本体实现。
具体的数据挖掘算法和域应用解决方案是数据挖掘本体的实例,是用户应用的核
- I -
心。研究了反洗钱领域数据挖掘应用解决方案实例,包括应用域的层次,若干基本的
数据挖掘算法,数据挖掘应用解决方案和所用算法间的映射等。主要实现可疑交易甄
别、交易网络分析和洗钱模式发现等数据挖掘应用,给出了可视化链接分析方法,可
实现交互式可视化的交易网络分析,提出了基于图熵的链接发现算法,可有效地发现
交易网络的关键节点,给出改进的基于的频繁子图发现算法,用于交
易网络的结构分析。
用户可利用域数据集成本体提供的语义模型,在数据挖掘本体的指导下选择数据
挖掘算法和应用解决方案以定义具体的数据挖掘任务。在用户需求获取完成以后,接
下来就是要根据用户需求选择合适的数据挖掘服务执行,而大多数最终用户并不具备
这样的专业知识。从方便用户的角度出发,系统需提供一套服务选择机制,来帮助用
户选择高质量的数据挖掘服务。系统综合通用服务的评价标准、数据挖掘领域的
专用评价因子及用户评价反馈等多种因素及服务的动态性,给出了一个较全面的数据
挖掘服务评价本体,讨论了服务质量的评价方法,给出了基于服务质量评价的动态数
据挖掘服务选择方法,用户可根据数据挖掘服务评价本体的语义模型,输入质量约束
条件,也可以调整评价因子权值,系统在满足用户约束条件的服务集中,通过计算出
服务的综合质量值,挑选最适合的算法执行。
基于上述成果,实现了一个外汇反洗钱领域的隐私保护数据集成和数据挖掘服务
选择的原型系统,并总结了系统设计特点。
关键词:数据挖掘,面向服务的体系结构,本体,语义数据集成,隐私保护,
质量评价,服务选择

- II -
Abstract
In order to solve the problem of large-scale distributed data mining (DM), one kind of
architecture is needed to facilitate data resource integration, offer high quality data mining
service (DMS) with higher s

面向服务数据挖掘关键技术与研究 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数118
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2286107238
  • 文件大小0 KB
  • 时间2015-10-21