大数据成功关键 --.IBM软件部资深信息整合顾问InfoSphere:维护信息供应链信息治理治理质量安全和隐私生命周期标准事务和协作应用业务分析应用外部信息源分析整合管理多维数据集流大数据主数据内容数据流信息数据仓库内容分析整合和清洗3ThirstforInformation可靠信息移动的速度敏捷用户想要快速地访问数据,几分钟内和小时级内(如自主的数据整合)对分析的需求两者都需要!权威性在一个流程框架内内的可靠信息避免信息冗余需要敏捷和可靠的数据访问任何数据到大数据大数据到任何数据大数据中心批量数据整合(用于大数据)任何数据ETL/ELTETL/ELTELT加载获益利用探索性分析方法最佳性能/最小批处理窗口和实时流数据提取获益从多种来源提取数据:机器数据、社交数据、多结构成熟的整合工具,更高的生产力数据中心获益以大数据形式产生和分析的数据–从不清除用于完成大数据运行时内的工作的图形工具将现有的企业数据引入一个探索性分析平台将社交数据和机器数据引入一个企业数据仓库系统自动化一个低成本数据暂存区域的工具对数据的推送处理(不是其他方法)BigInsightsHadoopInfoSphereBigInsights的批量数据整合集市数据仓库仓库集市DataStage数据库FilesFiles文件并行写入DataStage子集并行读取细节和摘要与大数据来源交换信息将企业信息转移到大数据来源,使它可包含在分析中获取Hadoop的分析结果,并将它们应用于其他IT解决方案并行性和规模对HDFS的支持通过信息服务器并行引擎提供了大规模可伸缩性作业血统与大洞察来源/目标步骤使用信息服务器中的扩展性功能大数据文件组件使用BDFS作为来源BDFS引入了新来源选项NamenodeClusterHost和PortBDFS可并行读取文件模式BDFS可使用Readers选项并行读取单个文件BDFS数据流程图名称节点文件请求BDFS数据节点BDFS数据数据PXPXBDFS使用多个读取器流程并行化HDFS读取InfoSphereDataStage使用BDFS作为目标BDFS引入了新的目标选项NamenodeClusterHost和PortBDFS通常写入单个文件BDFS能够并行写入多个文件
大数据成功关键 来自淘豆网m.daumloan.com转载请标明出处.