作者简介

尚硅谷IT教育一直坚持“技术为王”的发展理念,我们专注技术,不断钻研课程,团队中技术型人才占比60%以上,设有独立的研究院,与多家互联网大型企业的研发团队保持技术交流,保障教学内容始终基于研发一线。

内容简介

大数据发展至今,早已不是一个新兴词语,大数据的应用已经无处不在。在大数据时代,我们面临的不仅是海量的数据,更重要的是海量数据所带来的数据的采集、存储、处理等方方面面的问题。为了更快速、更全面地展示大数据的实践应用,《大数据分析》以一个数据仓库项目为切入点,带领读者一步步揭开大数据的面纱。


尚硅谷IT教育一直坚持“技术为王”的发展理念,我们专注技术,不断钻研课程,团队中技术型人才占比60%以上,设有独立的研究院,与多家互联网大型企业的研发团队保持技术交流,保障教学内容始终基于研发一线。

下载地址

豆瓣评论

  • 中华有神功
    2021-71 详细的数仓搭建 业务数据mysql,用户行为数据nginx负载均衡打到日志服务器,以文件形式落盘到日志服务器上。保存30天用flume来监控日志里,实时采集日志信息。Kafka:1很多人在使用,生态很完备2 可以高效读写 A有分区概念,多分区之间可以并行读写 B page cache C 顺序读写基于kimball的维度建模:ods:3件事,保持数据原貌、创建分区表、采用压缩dwd:第1步选择业务过程,第2步声明力度,第3步确定维度,第4步确定事实 数据清洗、脱敏、压缩、列式存储 dws:2件事,站在维度看事实,看事实表的度量值 dwt:和dws一样,两件事。开始日期?结束日期?从开始到结束累计发生的度量值,以及最近一段时间累计发生的度量值ads多个指标 结尾可视化展示07-17
  • L小姐
    嗯……怎么说呢,是一本翻开满页都是代码的书03-14

猜你喜欢

大家都喜欢