大规模数据处理实战(更新完毕)

所属分类：Geek

开篇词 (1讲)开篇词 | 从这里开始，带你走上硅谷一线系统架构师之路

第1章 | 直通硅谷大规模数据处理技术 (3讲)

01 | 为什么MapReduce会被硅谷一线公司淘汰？

02 | MapReduce后谁主沉浮：怎样设计下一代数据处理技术？

03 | 大规模数据处理初体验：怎样实现大型电商热销榜？

第2章 | 实战学习大规模数据处理基本功 (8讲)

04 | 分布式系统（上）：学会用服务等级协议SLA来评估你的系统

05 | 分布式系统（下）：架构师不得不知的三大指标

06 | 如何区分批处理还是流处理？

07 | Workflow设计模式：让你在大规模数据世界中君临天下

08 | 发布/订阅模式：流处理架构中的瑞士军刀

09 | CAP定理：三选二，架构师必须学会的取舍

10 | Lambda架构：Twitter亿级实时数据分析架构背后的倚天剑

11 | Kappa架构：利用Kafka锻造的屠龙刀

第3章 | 抽丝剥茧剖析Apache Spark设计精髓 (3讲)

12 | 我们为什么需要Spark？

13 | 弹性分布式数据集：Spark大厦的地基（上）

14 | 弹性分布式数据集：Spark大厦的地基（下）

15 | Spark SQL：Spark数据查询的利器

16 | Spark Streaming：Spark的实时流计算API17 | Structured Streaming：如何用DataFrame API进行实时数据分析?

18 | Word Count：从零开始运行你的第一个Spark应用

19 | 综合案例实战：处理加州房屋信息，构建线性回归模型

20 | 流处理案例实战：分析纽约市出租车载客信息

21 | 深入对比Spark与Flink：帮你系统设计两开花

22 | Apache Beam的前世今生

23 | 站在Google的肩膀上学习Beam编程模型

24 | PCollection：为什么Beam要如此抽象封装数据？

25 | Transform：Beam数据转换操作的抽象方法

26 | Pipeline：Beam如何抽象多步骤的数据流水线？

27 | Pipeline I/O: Beam数据中转的设计模式

登录 注册 找回密码