申请上海交通大学硕士学位论文
分布式环境中的性能预测方法
论文作者 付继文
学 号 1100339074
指导教师 曹健教授
专 业 计算机应用
答辩日期 2013 年 1 月 6 日
Submitted in total fulfilment of the requirements for the degree of Master
in Computer Application
Performance Prediction Model in
Distributed environment
F J
Supervisor
Prof. C J
D C S, S E E
E
S J T U
S,
Jan. 6th, 2013
分布式环境中的性能预测方法
摘 要
在过去的十几年里,分布式计算技术得到了广泛的研究和应
用。在分布式系统中,用户共享所有的资源,彼此之间存在着竞争
关系,为了提高分布式系统的性能,有效的资源分配机制显得格外
重要。而准确的对资源使用情况进行预测可以使资源分配更加有
效,所以本文将主要研究如何更准确的对各种资源使用情况进行预
测。通常将系统资源使用情况看做时间序列进行分析和预测,传统
的时间序列分析方法如自回归模型等都可以用于系统资源使用情况
的分析和预测,近些年来更多的非线性模型被应用于时间序列的预
测也取得了很好的效果。
根据参考变量维度的不同,时间序列的预测可以分为单变量预
测和多变量(多维度)预测。现有的各种预测模型都存在对数据的
敏感性,往往在不同数据集上预测效果相差较大。另外实际情况
下,在多变的分布式系统中,也很难保证特定机器上某种资源的变
化规律一成不变。因而在本文中,我们提出了一种两层反馈式集成
预测模型,一方面根据集成学习的思想提高预测的准确度与适应
度,另一方面,不断对各个基础预测器进行优化,更进一步的提高
预测能力。预测器优化模块使预测器集成模块获得更好的结果,同
时预测器集成模块会根据集成的结果反作用于预测器优化模块,这
种相互作用不断提高集成预测模型的预测能力。
首先我们将该集成预测模型应用于单变量预测,将常用的几种
单变量预测模型进行集成,并通过设计一系列的实验验证了集成预
— i —
上海交通大学硕士学位论文 摘要
测模型的预测能力。接下来,我们介绍了几种多变量预测模型,在
多变量预测中机器学习的方法取得了很好的效果,我们对其中的支
持向量机回归预测模型进行了优化,然后与其他几种多变量预测模
型一起构成我们的多变量集成预测模型。通过一系列的实验表明,
该集成预测模型在多变量预测中同样有较为理想的效果。
关键词: 分布式 性能 时间序列 预测 机器学习
— ii —
Performance Prediction Model in Distributed
environment
ABSTRACT
In the past 20 years, distributed computing has been developed rapidly
and used widely to satisfy the demands for computing po
分布式环境中的性能预测方法 来自淘豆网m.daumloan.com转载请标明出处.