前言

2013年是大数据元年,对于大数据从业者来说,从技术的乏善可陈到百花齐放,从以前大数据只是一个计算机学科的名词,到现在全民对大数据的喜闻乐见,距今不过几年。随着大数据与人工智能写进了“十三五”规划,在国家层面的设计中,大数据占有重要的一席之地。大数据将会深刻地影响各行各业和人们的衣食住行已是毋庸置疑的事实。

Spark源自加州大学伯克利分校的AMP实验室,经过开源社区的多年耕耘,目前已发展成大数据生态圈中最重要的技术之一。Spark的流行不仅在计算机从业人员中,而且一些业务人员、产品经理也经常用Spark进行数据分析,Spark的影响力可见一斑。

在IT时代全面转向DT时代的过程中,机遇与挑战并存,掌握Spark对于想快人一步的读者无疑是非常重要甚至是必备的,帮助他们以最快的速度达到目标正是本书的写作目的。