作品简介
作为一个通用大数据计算框架,Spark广泛应用于多种典型大数据分析场景。
通过这本书,你将了解到:Spark的机制与生态系统,Spark算法分析与应用,典型的数据分析场景,Spark在日志分析、情感分析、协同过滤、个性化推荐、社交网络分析、搜索、文本分析等场景的应用,Spnrk与其他开源工具及系统的集成。
Spark已经在全球范围内被广泛使用,无沦是微软、Intel、阿里巴巴、百度、腾讯等国际互联网巨头,还是一些初创公司,都在使用Spark。本书作者结合实战经验,编写了这本书。本书抽象出典型数据分析应用场景,适当简化,只进行主干介绍,讲解Spark应用开发、数据分析算法,并结合其他开源系统与组件,勾勒出数据分析流水线全貌。
高彦杰 倪亚宇 著