2019 研究生毕业论文开题报告模板
一、课题来源: 本课题来源于作者在学习和实习中了解到的两
个事实,属于自拟课题。 其一,作者在 2011 年 7 月在 XXX 公司
调研,了解到现如今各行业都面临着数据量剧增长,并由此带来业务
处理速度缓慢,数据维护困难等问题。为了应对此挑战,很多企业开
实施大数据发展战略。现如今的大数据发展战略能够概括为两类,一
类是垂直扩展。即采用存储容量更大,处理水平更强的设备,此种方
式成本较大,过去很多大公司一直采用此种方法处理大数据。但自从
2004 年 Google 发布关于 GFS,MapReduce 和 BigTable 三篇技术论文之
后,云计算开始兴起,2006 年 Apache Hadoop 项目启动。随后从 2009
年开始,随着云计算和大数据的发展,Hadoop 作为一种优秀的数据分
析、处理解决方案,开始受到很多 IT 企业的注重。相较于垂直扩张所
需的昂贵成本,人们更钟情于采用这种通过整合廉价计算资源的水平
扩展方式。于是很多 IT 企业开始探索采用 Hadoop 框架构建自己的大
数据环境。 其二,作者自 2013 年 4 月在 XXX 实习过程中进一步
了解到,因为关系数据库在存储数据格式方面的局限,以及其 Schema
机制带来的扩展性上的不便,当前在绝大部分的大数据应用环境中都
采用非结构化的数据库,如列式存储的 Hbase,文档型存储的 MangoDB,
图数据库 neo4j 等。这些非结构化数据库因为可扩展性强、资源利用
率高,高并发、响应速度快等优势,在大数据应用环境中得到了广泛
的应用。但此种应用只解决了前端的业务处理,要真正利用大数据实
现商务智能,还需要为决策支持系统和联机分析应用等提供一数据环
境——数据仓库。为此,导师指导本文作者拟此题目,研究基于
Hadoop 框架的数据仓库解决方案。 二、研究目的和意义:
现如今,数据已经渗透到每一个行业,成为重要的生产因素。近年来,
因为历史积累和和数据增长速度加快,各行业都面临着大数据的难题。
事实上,大数据既是机遇又时挑战。合理、充分利用大数据,将其转
变为海量、高增长率和多样化的信息资产,将使得企业具有更强的决
策力、洞察发现力和流程优化等水平。所以,很多 IT 企业都将大数据
作为其重要的发展战略,如亚马逊、FaceBook 已布局大数据产业,并
取得了骄人的成绩。事实上,不止谷歌、易趣网或亚马逊这样的大型
互联网企业需要发展大数据,任何规模的企业都有机会从大数据中获
得优势,并由此构建其未来业务分析的基础,在与同行的竞争中,取
得显著的优势。 相较于大型企业,中小企业的大数据发展战略不
同。大公司能够凭借雄厚的资本和技术实力,从自身环境和业务出发,
开发自己的软件平台。而中小企业没有那样的技术实力,也没有那么
庞大的资金投入,更
2019研究生毕业论文开题报告模板 来自淘豆网m.daumloan.com转载请标明出处.