kettle——入门操作(行扁平化)

行扁平化,多行记录只有一个字段不同时,将不同字段转变为列。如下,最后解释一下原理及设计不足之处。

第一种情况,数据特点,flag为a的有两行,flag为b的有三行

      

    行扁平化设置,扁平化后的目标字段,输入流中Grid Data 中flag为b的有三个:1,2,3,所以我们在这里也需要设计三列

      

    看最后excel结果,what,怎么只有b了?

      

        What?和预想的不一样啊!!!!!

第二种情况,这次数据比较规范,a,b都只有两行。

      

    看行扁平化控件设置如下,我们设置的扁平化的目标字段也有两个,type1和type2

      

     看最后Excel输出结果,

      

    这次结果对了,看下面的。

第三种情况,数据和第二种情况一样,

      

    行扁平化控件设置,如下,此处和第一种情况一样。

      

    看Excel输出结果,

      

    这什么情况?a呢?

 总结:此控件只能满足相同数据行(一列不同)数据一样的情况,一旦出现不一样的情况将不再适用。

      控件在输入流统计数量的时候,以控件增加的列为统计重复次数。且把统计的最后一行作为重复记录输出,这就是为什么1,3出现b而缺少a的原因。

原文地址:https://www.cnblogs.com/wind-man/p/7931969.html