纵横大数据:云计算数据基础设施 pdf
大数据的概念很火,但人们对它的认识却是混乱的:有人说大数据就是指所有的数据,有人说大数据是指线上行为、日志等半结构/非结构化的数据形态,有人说大数据就是以Hadoop为代表的新技术……到底什么是大数据?同样风风火火了很久的云计算与大数据有什么关系?令人眼花缭乱的众多大数据技术的本质是什么?各有什么优缺点?争论不休的“小变大”与“大变小”技术策略到底孰正孰邪?企业究竟应该如何定位与使用大数据,难道是为了Hadoop而Hadoop?未来的技术方向究竟如何?本书结合现代企业数据管理实践,从策略、技术、应用、企业数据架构等多个维度,体系化地对大数据及相关技术进行了全面深入的论述:首先对大数据相关概念予以澄清;接着深入剖析各种大数据技术的内在本质,指出其各自的优缺点、适用场景与相互关系;同时对大数据技术“分”与“合”这两种广受争议的技术策略的内在联系进行了分析与讨论,明确指出现代数据管理技术的发展趋势;最后结合大数据时代企业新一代数据架构规划的实际,对大数据及相关技术在企业数据体系中的具体定位给出了切实可行的建议,并且面向云数据中心建设,提出了大数据云――云计算数据基础设施的概念与方法。