内容简介

要在Hadoop生态系统中实现数据的快速输入和快速分析,一直以来只有少数可用但是不够完美的解决方案。它们要么以缓慢的数据输入为代价实现快速分析,要么以缓慢的分析为代价实现快速的数据输入。这个问题现在有了解决办法,使用Apache Kudu基于列的数据存储,可以很容易地对快速输入的数据进行快速的分析。这就是《Kudu:构建高性能实时数据分析存储系统》的内容。

在《Kudu:构建高性能实时数据分析存储系统》中,你将学习Kudu设计中的关键概念,以及如何用它构建快速、可扩展和可靠的应用程序。通过实际的示例,你将了解Kudu是如何与其他Hadoop生态系统组件(如Apache Spark、Spark SQL和Impala)集成的。

《Kudu:构建高性能实时数据分析存储系统》适合大数据系统的架构师、开发者和咨询师阅读。

下载地址

豆瓣评论

  • 风空之枫
    前两章可以简单看一下,虽然已经是 2022 年烂俗的车轱辘话(OLTP OLAP Streaming Hadoop 生态 HTAP),不过还是有一些 cloudera 的实践的。部署的时候 SSD / HDD 选择的部分可以看看。其他都没啥意思,没有任何细节部分,不如看官方文档08-19
  • 金羚
    基础架构和使用运维方面的10-12

猜你喜欢

大家都喜欢