pentaho data-integration(kettle) 资源库备份

网上抄来的,验证过,好用,哈哈

https://blog.csdn.net/zhoujianfeng3/article/details/53667327?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control

pentaho data-integration (又称kettle ,后面简称PDI )关于资源库备份这块有很多方法,将我有用到的几种方法分享给大家。

1. 如果资源库是保存在传统数据库中,如mysql、oracle等,可直接备份资源库相关的几张表。(把整个数据库或者scheme的对应数据库备份成文件)

2. 不定时手动导出资源库,把数据库类型的资源库导出来成文本类型资源库。(常见情况就是把公司资源库作业导出道本机)

3. 使用PDI 作业中自带的组件进行自动导出。

前面两种就不介绍了,重点讲下第三种方式。

打开 PDI 工具界面,创建 一个 JOB ,然后在 JOB 的组件中选中 ‘导出资源库倒xml文件’,如下

 

这个组件中,导出支持多种形式,你可以导出整个资源库文件,也可以导出某一个文件夹的文件,亦或者某个单独文件。我这测试导出某个文件夹的文件。如下

然后运行这个job ,就可以生成一个资源库文件了。文件内容如下

<?xml version="1.0" encoding="UTF-8"?>
<repository>


<transformations>
<transformation>
  <info>
    <name>ktr_field_test_dealing</name>
    <description/>
    <extended_description/>
    <trans_version/>
    <trans_type>Normal</trans_type>
    <trans_status>0</trans_status>
    <directory>&#x2f;</directory>
    <parameters>
    </parameters>

这个一个xml格式的内容。然后使用PDI 中的资源库导入功能导入即可。

导入功能:   工具-》资源库-》导入资源库  (后面具体的操作我就不细述了)

导入之前,我的资源库文件目录如下:

导入之后我的资源库文件目录如下

原文地址:https://www.cnblogs.com/gina11/p/14331289.html