使用sql语句比较excel中数据的不同

使用sql语句比较excel中数据的不同

我所在的项目组是一套物流系统,负责与公司的电商系统进行对接。但是公司的电商系统的省市区的配置和物流系统的省市区的配置有差异,所以需要找到这些差异。

首先找到我们物流系统中所开站点的省份,物流没有开的站点省份,电商网站开了,不需要分别出站点的配置区别。


SELECT A.NAME 省, B.NAME 市, C.NAME 区
  FROM BIS_PROVINCE A, BIS_CITY B
  LEFT JOIN BIS_DISTRICT C
    ON B.ID = C.CITY_ID
 WHERE A.ID = B.PROVINCE_ID
   AND A.NAME IN ('江苏省',
                  '江西省',
                  '安徽省',
                  '浙江省',
                  '山东省',
                  '河北省',
                  '湖北省',
                  '湖南省',
                  '陕西省',
                  '河南省',
                  '福建省',
                  '广东省',
                  '四川省',
                  '重庆市');

这个是物流系统所开设的站点的省份

接着创建两个临时表,分别存储物流系统的地址配置信息和电商系统的地址配置信息。

创建物流系统地址配置信息的临时表,代码如下:


CREATE TABLE WL_ZONE AS(
  SELECT A.NAME 省, B.NAME 市, C.NAME 区
    FROM BIS_PROVINCE A, BIS_CITY B
    LEFT JOIN BIS_DISTRICT C
      ON B.ID = C.CITY_ID
   WHERE A.ID = B.PROVINCE_ID
     AND A.NAME IN ('江苏省',
                    '江西省',
                    '安徽省',
                    '浙江省',
                    '山东省',
                    '河北省',
                    '湖北省',
                    '湖南省',
                    '陕西省',
                    '河南省',
                    '福建省',
                    '广东省',
                    '四川省',
                    '重庆市'));

再接着创建电商系统的地址配置信息表,同样的表结构,但是不复制信息,代码如下:


CREATE TABLE DH_ZONE AS
  SELECT A.NAME 省, B.NAME 市, C.NAME 区
    FROM BIS_PROVINCE A, BIS_CITY B
    LEFT JOIN BIS_DISTRICT C
      ON B.ID = C.CITY_ID
   WHERE A.ID = B.PROVINCE_ID
     AND A.NAME IN ('江苏省',
                    '江西省',
                    '安徽省',
                    '浙江省',
                    '山东省',
                    '河北省',
                    '湖北省',
                    '湖南省',
                    '陕西省',
                    '河南省',
                    '福建省',
                    '广东省',
                    '四川省',
                    '重庆市')
     AND 1 = 0;

这个最后的1=0,作用就是值复制表的结构但是不复制表的数据。

注意:电商系统是将电商网站的地址信息导出成excel表格传给我,所以要将excel的数据保存到数据库中。

首先打开excel,在第一列的表头,右键--->插入,插入一列,然后复制所有信息,再在数据库中的临时表中DH_ZONE,粘贴,就可以将数据存储到数据库中了。

注:在excel的第一列前插入一列是关键。不然无法保存到数据库中

在进行地址信息的对比的时候有两种情况:

1.物流系统有这个地址而电商系统没有

2.电商系统有这个地址而物流系统没有

所以查找不同分这两种情况:

第一种:


SELECT WZ.省, WZ.市, WZ.区
  FROM WL_ZONE WZ
 WHERE NOT EXISTS (SELECT *
          FROM DH_ZONE DZ
         WHERE DZ.省 || '省' = WZ.省
           AND DZ.市 || '市' = WZ.市
           AND DZ.区 = WZ.区)
 ORDER BY WZ.省;

第二种:


SELECT DZ.省, DZ.市, DZ.区
  FROM DH_ZONE DZ
 WHERE NOT EXISTS (SELECT *
          FROM WL_ZONE WZ
         WHERE DZ.省 || '省' = WZ.省
           AND DZ.市 || '市' = WZ.市
           AND DZ.区 = WZ.区)
 ORDER BY DZ.省;

至于为什么where语句要写成


    WHERE DZ.省 || '省' = WZ.省
    AND DZ.市 || '市' = WZ.市
    AND DZ.区 = WZ.区)

有两个原因:
1.电扇系统传给我的地址是只有省市区的名称,但是名称后缺少"省""市"
2.中国的四大直辖市,他们的省就是"北京市""重庆市""上海市""天津市"

所以要写成这样,其实这个直辖市的情况还可以用case when end语句进行判断。

原文地址:https://www.cnblogs.com/dushan/p/5130264.html