下载此文档

八骏马图.docx


文档分类:金融/股票/期货 | 页数:约21页 举报非法文档有奖
1/21
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/21 下载此文档
文档列表 文档介绍
摘要时问序列数据是一类重要的复杂数据对象,广泛存在于自然现象和社会经济等领域中,应用数据挖掘技术分析时间序列数据足一项具有现实意义的工作,数据挖掘技术应用于时间序列数据库能够发现时间序列中所蕴涵的知识,数据挖掘技术在时问序列中的主要应用有规则发现、周期模式挖掘、相似性搜索和序列模式发现等方面。本文探讨时问序列的相似性度量及相似子序列的搜索方法。时间序列数据具有高维性、含噪声、振幅轴伸缩、时间轴漂移等多种变形,这造成时间序列数据挖掘困难,对时间序列数据首先进行去噪声和规范化预处理,包括数据填补缺失、数据清洗、维数约减,消除不一致等技术,得到商质量的数据以便处理。在目前时间序列相似性挖掘的研究中,列时问序列数据库的描述、存储、检索等操作,通常都是基于序列幅度值和时问坐标进行的。采用以点距离为度量标准。如线性·卜均分段累积近似方法(PAA,PiecewiseAggregateApproximation),点距离不能克服时问序列幅度值伸缩和时问轴漂移以及高维误匹配等方面的不足,为此本文提出以时间序列模式距离为度量的标准,直观时问序列曲线变化,会发现~些能标志时问序列曲线动态变化的点,将其称作关键点,以关键点为边界分割时间序列,用各分段拟台时间序歹0变化模式,提取各分段拟合的形态特征向量(斜率反正切值)。关键点的选择必须满足各段线性拟合的误差阈值,为提高分段线性拟合的准确性,提出一种相对误差闽值的改进算法,使关键点反映时间序列变化的总体趋势和特征。在现有相似子序列搜索方法的基础E,根据其不足,本文提出改进算法,苗先考虑各分段线性拟合的时间跨度。海量的时间序列数据库各段模式特征的存储搜索的规模很大,将分段序列的特征向量进行离散化分类,以字符代替各分段时间序列,后缀树结构存储各分段序列的形态特征字符,在给定序列树中快速有效地检索与查询序列相似的子序列,这种算法能够对不同取值范围、不同K度的子序列进行有效的搜索,实现了序列数据库在卟同划分粒度下的相似性检索。提出离散化边界模糊分类的方法,实验表明此改进方法优化了相似子序列的查全率。本文最后与目前的PAA方法比较,通过实验证明关键点分割线性拟合的方法有效可行。相对误差修正方法,增加关键点数,相应提高了相似搜索的查仝率,但所需的时间较长,有待以后的研究中得以提高。关键词:数据挖掘、时间序列、关键点、形态特征、,periodicpatternmining,similaritysearch,,that,findsthesequencedatathataresimilarwiththegiventimeseries,studiesthestandardofthetimeseries’similarityandthefastsearchalgorithInThemainwork1istedasfollowing:Timeseriesdataareofhighdimension,noise,andvariousdistortionssuchasamplitudescaling,pressinginthetime-—noiseandstandardizationprocessing,includingthefillingupthemissingdata,datacleaning,dimensionreducing,-liningwiththekeypoint,fittingthesegmentslinearlywithmaximumlikelihoodfunctionandthelea

八骏马图 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数21
  • 收藏数0 收藏
  • 顶次数0
  • 上传人875845154
  • 文件大小0 KB
  • 时间2016-02-22
最近更新