datax踩坑

datax使用心得:

1.下载路径:https://github.com/alibaba/DataX 在页面中【Quick Start】--->【Download DataX下载地址】进行下载。下载后的包名:datax.tar.gz。解压后{datax}目录下有{bin conf job lib log log_perf plugin script tmp}几个目录。

 2.由于现在用的 python 版本大多为 python3 ,所以把 [datax_hoem]/bin 目录下的三个py文件修改成了符合 python3 语法要求的文件,执行也没报错,修改后的文件,如需要可下载替换:https://github.com/TwoThreeWang/DataX_Python3

3.建立csv到mysql的json文件(命名为test.json)

{
     "job": {
          "setting": {
              "speed": {
                  "channel": 2
              }
         },
          "content": [
              {
                "reader": {
                     "name": "txtfilereader",
                     "parameter": {
                        "path": ["D:/a.csv"],
                         "encoding": "UTF-8",
                         "column": [
                             {
                                 "index": 0,
                                 "type": "string"
                             },
                             {
                                 "index": 1,
                                 "type": "string"
                             }
                         ],
                         "fieldDelimiter": ";",
                         "skipHeader": "False"
                    }
                 },
                 
                "writer": {
 
                    "name": "mysqlwriter",
 
                     "parameter": {
 
                       "writeMode": "insert",
 
                        "username": "root",
 
                         "password": "ljm",
 
                        "column": [

                            "http",
 
                             "https"
 
                         ],
 
                         "session": [],
 
                         "connection": [
 
                             {
 
                                 "jdbcUrl": "jdbc:mysql://127.0.0.1:3306/big_shuju?useUnicode=true&characterEncoding=utf8&useSSL=false&serverTimezone=GMT%2B8",
 
                                 "table": ["test"]

                             }
 
                         ]
 
                     }
 
                 }                 
                
             }
         ]
     }
 }

  注:密码不能为空,如果mysql连接密码是空,请提前修改密码。

4.启动datax的执行命令:python datax.py D:DataX-json est.json(注:后面的是json文件路径,控制台运行时提前切换到datax/bin目录)

5.控制台出现乱码:直接输入CHCP 65001即可

 测试截图:

 

原文地址:https://www.cnblogs.com/ljm-zsy/p/12391406.html