1.groupByKey的源代码
2.groupByKey的使用缺点
不使用groupByKey的主要原因:在大规模的数据下,数据分布不均匀的情况下,可能导致OOM
3.reduceByKey的源代码
4.使用reduceByKey的youdian
使用reduceByKey函数的主要原因是:reduceByKey中存在combiner
本文共 181 字,大约阅读时间需要 1 分钟。
1.groupByKey的源代码
2.groupByKey的使用缺点
不使用groupByKey的主要原因:在大规模的数据下,数据分布不均匀的情况下,可能导致OOM
3.reduceByKey的源代码
4.使用reduceByKey的youdian
使用reduceByKey函数的主要原因是:reduceByKey中存在combiner
转载地址:http://fkvoo.baihongyu.com/