kettle 常用组件

Dummy步骤不会做任何事情。它的主要功能是作为以测试为目的的占位符。

追加流

分析查询(前后行查询),步骤:增加常量数据包括id,name连个字段,增加自增列autoid字段,按id,outid进行升序排列,使用分析查询,按ID分组获取每行的前后行数据

 

阻止执行直到某步骤执行完

分组

计算器

判断字段是否存在

 判断表是否存在

 克隆行(一行数据,增加了序列,克隆两条,变为三条记录,Y表示克隆行)

Closure Generator=结束操作
=允许利用ID的父子关系生成一个结束表

 联合查询更新(更新维度表)

步骤错误处理设置

过滤记录

字段的校验,通过增加多个校验,可以校验多个字段

行延迟(每行延迟1S)

去重

在不做排序的情况下:

按ID排序后去重:

 字段加密:

//Script here

var encrypted_password = 'not encrypted';

encrypted_password = "Encrypted " + Packages.org.pentaho.di.core.encryption.Encr.encryptPassword(clear_password);

Excel输入(以sample-file.xls的工作表sheet1为例)

sheet1的内容如下:

浏览选择sample-file.xls,点击添加按钮

可以手动录入,也可以通过选择工作表名称按钮添加工作表,注意其实行起始列,因为sheet1中,从第一行,第一列开始有数据,因此起始行起始列为1;

内容标签中,如果首行为列头,则选择头部。

可以点击获取头部的字段来获取字段名称

excel输出(生成记录导出到excel)

字段拆分

拆分字段的合并(通过计算器进行合并,计算后移除中间字段)

原文地址:https://www.cnblogs.com/playforever/p/9798233.html