基于版本 2.4.0
当前离线数据处理多是使用的Spark技术框架,为了深入理解Spark,阅读整理了Spark技术资料。
当前已经整理以下几个专题 :
- Spark 执行模式 : Yarn/K8s 实现方式
- Spark 核心功能 : RDD 的原理解读
- Spark 执行原理 : DAG 执行解读
- Spark 执行原理 : Shuffle原理解读
- Spark 通信原理 : RPC 解读
内容不定期更新,欢迎阅读并给出意见。
如果对你有用,记得点 Star
基于版本 2.4.0
当前离线数据处理多是使用的Spark技术框架,为了深入理解Spark,阅读整理了Spark技术资料。
当前已经整理以下几个专题 :
内容不定期更新,欢迎阅读并给出意见。
如果对你有用,记得点 Star