Spark RDD概念学习系列之如何创建Pair RDD

  不多说,直接上干货!

创建Pair RDD

Python语言
pairs = lines.map(lambda x: (x.split(" ")[0], x))

 scala语言

val pairs = lines.map(x => (x.split(" ")(0), x))

Java语言

PairFunction keyData =
    new PairFunction() {
    public Tuple2 call(String x) {
        return new Tuple2(x.split(" ")[0], x);
    }
};
JavaPairRDD pairs = lines.mapToPair(keyData);
原文地址:https://www.cnblogs.com/zlslch/p/6941317.html