作者根据多年从事云计算学术研究和项目实施经历,从分布式计算的角度出发,深入浅出地对云计算的基本概念、云计算的核心实现技术及作者所在研究小组关于云计算的学术研究成果进行阐述。本书分为三大部分:第一部分为理论篇,主要介绍分布式计算及云计算理论方面的知识;第二部分为技术篇,重点介绍云数据中心的节能技术及作业调度策略,并深入剖析MapReduce框架存在的性能问题及其优化方法;第三部分为实践篇,以PageRank算法和DNA序列拼接算法的实现为例,讲述如何使用云计算解决实际问题,并以图计算框架Hama为例,阐述对开源云计算项目的性能进行评价的方法。附录中介绍了如何搭建云计算研发环境。