spark SQL之 Dataframe中na.fill的用法

spark SQL之 Dataframe中na.fill的用法

对两个数据表如A，B取JOIN操作的时候，其结果往往会出现NULL值的出现。

这种情况是非常不利于后续的分析与计算的，特别是当涉及到对这个数值列进行各种聚合函数计算的时候。

Spark为此提供了一个高级操作，就是：na.fill的函数。

其处理过程就是先构建一个MAP，如下：

val map = Map("列名1“　-> 指定数字, "列名2“　-> 指定数字, .....)

然后执行dataframe.na.fill(map)，即可实现对NULL值的填充。

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/sabertobih/p/13821131.html