下载此文档

Greenplum 分布式数据仓库软件特性介绍.docx


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
该【Greenplum 分布式数据仓库软件特性介绍 】是由【fengruiling】上传分享,文档一共【8】页,该文档可以免费在线阅读,需要了解更多关于【Greenplum 分布式数据仓库软件特性介绍 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。
Greenplum数据仓库软件是业界首创将大规模并行计算技术,应用到了数据库软件领域。该类技术同样应用在Google搜索引擎的中。
Greenplum数据仓库软件功能:
0无共享/MPP核心架构
Greenplum数据库软件将数据平均分布到系统的所有节点服务器上,所以节点存储每张表或表分区的部分行,所有数据加载和查询都是自动在各个节点服务器上并行运行,并且该架构支持扩展到上万个节点。
0混合的存储和执行(按列或按行)
Greenplum发明支持混合按列或按行存储数据,每张表或表分区可以由管理员根据应用需要,分别指定存
储和压缩方式。基于这个功能,用户可以对任何表或表分区选择按行或按列存储数据和处理方式。这些是
在建表或表分区的DDL语句中配置的,只需在建表或表分区时指定。这个功能基于Greenplum的多态维数据存储技术。
0多层次的容错能力
Greenplum数据仓库软件自己包含多层次容错和冗余能力,这是云计算架构软件的一个重要特征。该功能保证整个数据仓库系统在遇到硬件、软件的故障的情况下,仍然自动继续运行。
0在线系统扩容(永不停机)
在系统中增加节点服务器即可增加存储容量,处理性能和加载性能。当系统扩展时,数据仓库保持在线,并且完全可用,扩展进程在后台运行。增加节点服务器,性能和容量线性增加。
0负载管理(WorkloadManagement)
具有系统资源管控能力,并且可控制给各个查询分配各自系统资源。允许管理员指派资源队列,从而管理
数据仓库的队列进入执行情况。在运行的查询的优先级可以随时调整。
0PB级的装载能力基于MPPScatter/Gather流技术的高性能并行加载功能。加载速度随着节点线性增加,实际超过4TB/小时。
0灵活的外部数据访问数据仓库软件可在任意外部数据源上并行运行常规SQL,不论外部数据源的位置,格式或存储介质。
0数据库内压缩
利用业界领先的压缩技术,进一步提高性能,并极大地节省了数据存储空间。用户可获得3-10倍的空间节省,并且同时获得相应有效I/O性能提升。
0多层次表分区能力
允许灵活地按照时间、范围、值域划分表分区。表分区由DDL设定,分区层级不限。数据仓库软件的查询优化器自动从查询执行计划中略去不涉及的表分区。
0索引功能
Greenplum支持各种数据库索引技术,包括B-Tree,Bitmap等等。按列存储、按行存储数据库表都支持索引。
0完全遵从SQL最新标准
遵从SQL-92,SQL-99,至SQL2003标准,并包括SQL2003OLAP扩展项。所有SQL查询都是在系统上并行执行。
0原生MapReduce功能
MapReduce由Google发明,已被证实为一个高扩展性的文本非结构化数据分析的技术。Greenplum的并行数据库软件核心可原生运行MapReduce程序。
Ur
u
a

'iMerc&wect
5<^i7ient3rmrs
Greenplum
ETL&DIProdurts
ApptiCdtlQH^D&s
0支持SQL2003OLAP扩展标准
对SQL语言包括其OLAP扩展标准,都是在Greenplum数据仓库软件实现并行执行。全面支持SQL2003
OLAP标准,包括Window函数,Rollup,Cube等等。
0客户端访问及第三方工具支持
完全支持数据库技术接口标准,例如:SQL,ODBC,JDBC,OLEDB等。同时,广泛地支持各个BI和ETL软件
工具。
0Greenplum性能监控器
-个WebGUI的Greenplum数据仓库系统运行状态监控工具,可以监控操作系统级信息以及数据库软件
SQL运行状态细节。它的仪表盘可以查看,在SQL运行时,数据仓库系统资源利用情况。并且,还可以深
入显示当前或历史的SQL运行细节,帮助更深入理解某一SQL性能状况。
mlVvc4fl-libtjht^
?tn«t%«*&・•J33-
■■・JW**c匸Imlkw
£t¥A~
«>£
-ilsi#3匕
云jsl二豐累w-snsffl&-
匸¥¥tTud
IsmW
*0T-;uorH;tH<
■■wl"*r!i»Ks*^*fr£a-
IrfwgnMflFrr・r*HMc*2瓷・ltrnrl<n
s!E・"・Br/7^<_>rs/zl
<r*I
EffJHzrtsw
i2¥■«■家
>b-
4$34*■«$m-mll*■r・・•
Dt46f34^
um-d匚七o

Greenplum公司是世界领先的数据仓库基础平台供应商。它的杰出创新数据仓库软件产品技术,引领着数
据仓库领域和数据分析领域的发展方向。Greenplum公司的产品有GreenplumDatabase,Greenplum
Chrous—世界首创企业数据云平台(EnterpriseDataCloudplatform)。它的这些产品和服务体现了云计算、虚拟化计算、数据间社会关系的技术,使得全球各类组织可以比从前更好地从数据里获取更深的和更有价值的知识。
每一天,全球有数亿级的用户在直接、间接用到Greenplum发明的数据仓库平台。
Greenplum是2003年成立的,核心技术团队成员来自各个顶级数据库公司和大规模并行计算公司的资深
软件架构师,例如:Oracle,Teradata,Tandem,MicrosoftSQLServer,Informix,Netezza,Amazon,eBay,
,Yahoo.
Greenplum创新研发的产品有:
0GreenplumDatabase
Greenplum数据库软件是业内首创的大规模并行处理(massivelyparallelprocessing(MPP))的数据库软件产品,它包含大规模并行计算技术和数据库技术最新的研发成果:包括无共享/MPP,按列存储数据库,数据库内压缩,MapReduce,永不停机扩容,多级容错等等。
该软件产品被业界认可为扩展能力最大的分析型(OLAP)数据库软件。已有100多家世界级重大客户采用该软件,例如:NYSE,NASDAQ,AIG,德意志银行,美国联邦储备委员会,支付宝,淘宝,NTT-DoCoMo,T-Mobile,Skype,WalMart,中国电信等。
0GreenplumChorus
该产品是世界首创的企业数据云平台产品。它可以帮助客户构建数据仓库虚拟化计算环境,为各个不同的数据计算模型和任务创建自治的虚拟化数据仓库,把结构化,非结构化,数据量大小各异的各种数据都集中管理起来。同时,Greenplum数据库软件的并行化,为各个虚拟化数据仓库都提供了很高的处理速度,大大提高各个虚拟数据库上各个分析模型、任务的处理效率和分析质量。
Greenplum的产品线示意如下图:
Greenplum现有客户涵盖金融电信互联网零售运输医药政府等行业。这些客户中大多数Greenplum数据仓库所管理的数据量都超过100TB,其中,全球最大的有6500TB,中国最大的有400TB。

Greenplum 分布式数据仓库软件特性介绍 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人fengruiling
  • 文件大小333 KB
  • 时间2022-12-21