string(6) "算子" TAGS:算子 寻技术

TAGS:算子

Spark源码解析(一):RDD之Transfrom算子

一、延迟计算 RDD 代表的是分布式数据形态,因此,RDD 到 RDD 之间的转换,本质上是数据形态上的转换(Transformations) 在 RDD 的编程模型中,一共有两种算子,Transformations 类算子和 Actions 类算子。开发者需要使用 Transformations 类算子,定义并描述数据形态的转换过程,然后调用 Actions 类算子,将计算结果收集起来、或是物化

其他编程 2023年07月11日  69

关闭

用微信“扫一扫”