小册描述
目录
- 为什么MapReduce会被硅谷一线公司淘汰?
- MapReduce后谁主沉浮:怎样设计下一代数据处理技术?
- 大规模数据处理初体验:怎样实现大型电商热销榜?
- 分布式系统(上):学会用服务等级协议SLA来评估你的系统
- 分布式系统(下):架构师不得不知的三大指标
- 如何区分批处理还是流处理?
- Workflow设计模式:让你在大规模数据世界中君临天下
- 发布/订阅模式:流处理架构中的瑞士军刀
- CAP定理:三选二,架构师必须学会的取舍
- Lambda架构:Twitter亿级实时数据分析架构背后的倚天剑
- Kappa架构:利用Kafka锻造的屠龙刀
- 我们为什么需要Spark?
- 弹性分布式数据集:Spark大厦的地基
- Spark SQL:Spark数据查询的利器
- Spark Streaming:Spark的实时流计算API
- Structured Streaming:如何用DataFrame API进行实时数据分析?
- Word Count:从零开始运行你的第一个Spark应用
- 综合案例实战:处理加州房屋信息,构建线性回归模型
- 流处理案例实战:分析纽约市出租车载客信息
- 深入对比Spark与Flink:帮你系统设计两开花
- Apache Beam的前世今生
- 站在Google的肩膀上学习Beam编程模型
- PCollection:为什么Beam要如此抽象封装数据?
- Transform:Beam数据转换操作的抽象方法
- Pipeline:Beam如何抽象多步骤的数据流水线?
- Pipeline I/O: Beam数据中转的设计模式
- 如何设计创建好一个Beam Pipeline?
- 如何测试Beam Pipeline?
- Apache Beam实战冲刺:Beam如何run everywhere?
- WordCount Beam Pipeline实战
- Beam Window:打通流处理的任督二脉
- 横看成岭侧成峰:再战Streaming WordCount
- Amazon热销榜Beam Pipeline实战
- Facebook游戏实时流处理Beam Pipeline实战(上)
- Facebook游戏实时流处理Beam Pipeline实战(下)
- 5G时代,如何处理超大规模物联网数据
- 大规模数据处理在深度学习中如何应用?
- 从SQL到Streaming SQL:突破静态数据查询的次元
- 大规模数据处理未来之路