gpfdist工具的初级使用

gpfdist工具的使用主要两步:

第一步:打开gpfdist服务:

gpfdist -d /home/admin -p 8081 -l /tmp/gpfdist.log &

参数解释:

-d 数据文件所放的目录,我这里的路径为/home/admin。

-p 设置访问gpfdist端口,这个可以根据实际情况写。

-l 设置日志文件所放的目录,这个参数也可以不用填写。

* 必须注意“&”这个符号绝对不能忘记填写,不然开始服务会失败。

如果执行成功请看下图中出现的 Serving HTTP on port 8787,directory /home/admin

第二部:编写导入的sql语句:

1)准备数据文件:

2)准备sql脚本:

create external table test001_ext
(
 id integer
 ,name varchar(128)
)
Location
(
 'gpfdist://192.168.23.128:8081/test001.txt'
)
Format 'TEXT' (delimiter as ' ' null as '' escape 'OFF')
Encoding 'GB18030' Log errors into public.test001_err segment reject limit 10 rows

Location中填写的gpfdist://服务器地址:端口/文件名称

服务器地址:就是安装linux系统的ip。

端口:就是上面自己配饰的访问gpfdist的端口。

文件名称:就是准备的数据文件名称。

format:设置加载数据文件的格式,delimiter as 定义数据之间的分隔符,这里用到的是空格, null as 定义了null用空值替换。

Encoding 设置数据的编码格式。

Log 设置了加载数据错误的日期会存放到test001_err这张表。

原文地址:https://www.cnblogs.com/daojiao/p/4589038.html