oracle04--伪列

1. 伪列

1.1. 什么是伪列

伪列是在ORACLE中的一个虚拟的列。

伪列的数据是由ORACLE进行维护和管理的，用户不能对这个列修改，只能查看。

所有的伪列要得到值必须要显式的指定。

最常用的两个伪列：rownum和rowid。

1.2. ROWNUM

ROWNUM（行号）：是在查询操作时由ORACLE为每一行记录自动生成的一个编号。

每一次查询ROWNUM都会重新生成。（查询的结果中Oracle给你增加的一个编号，根据结果来重新生成）

rownum永远按照默认的顺序生成。（不受order by的影响）

rownum只能使用 <、 <= ，不能使用 > 、>= 符号，原因是：Oracle是基于行的数据库，行号永远是从1开始，即必须有第一行，才有第二行。

1.2.1. 行号的产生

--需求：查询出所有员工信息，并且显示默认的行号列信息。

SELECT ROWNUM,t.* FROM emp t; -- * 和指定的列一起显示的时候，必须加别名

提示两点：

ROWNUM是由数据库自己产生的。ROWNUM查询的时候自动产生的。

1.2.2. 行号的排序

--需求：查询出所有员工信息，按部门号正序排列，并且显示默认的行号列信息。

SELECT ROWNUM,t.* FROM emp t ORDER BY deptno;

--order by 原理：将查询结果（此时行号已经有了，已经和每一行数据绑定了）进行排序。

--order by 是查询语句出来的结果之后再排序的，rownu是在查询出来结果的时候产生。order by不会影响到行号

--先排序，再查询

SELECT ROWNUM,t.* FROM

(

SELECT * FROM emp ORDER BY deptno

) t

结论：

order by排序，不会影响到rownum的顺序。rownum永远按照默认的顺序生成。

所谓的“默认的顺序”，是指系统按照记录插入时的顺序（其实是rowid）。

1.2.3. 利用行号进行数据分页-重点

回顾mysql如何排序？

select * from table limit m,n
其中m是指记录开始的index，从0开始，表示第一条记录
n是指从第m+1条开始，取n条。

select * from tablename limit 3,3
即取出第4条至第6条，3条记录

Oracle如何分页呢？

结论：Mysql使用limit的关键字可以实现分页，但Oracle没有该关键字，无法使用该方法进行分页。

SELECT ROWNUM,t.* FROM emp t; --查询所有记录

--需求：根据行号查询出第四条到第六条的员工信息。
SELECT ROWNUM,t.* FROM emp t WHERE ROWNUM >=4 AND ROWNUM<=6;--错误
-- rownum只能使用 < 、<=，不能使用 > 、>=符号，原因是：Oracle是基于行的数据库，行号永远是从1开始，即必须有第一行，才有第二行。

SELECT ROWNUM,t.* FROM emp t WHERE ROWNUM<=6; -- 查询1-6条记录

--方案：可以使用子查询（根据行号查询出第四条到第六条的员工信息）
SELECT rownum,t2.* FROM
(
SELECT ROWNUM r,t.* FROM emp t WHERE ROWNUM<=6
        --此时子查询的rownum已经变成了虚表的一个列
) t2   --尽量让虚表尽量小
WHERE t2.r >=4

Mysql分析：
--需求：要分页查询，每页3条记录，查询第二页
/*
      pageNum=2  当前页码
      pageSize=3  最大记录数（即每页显示几条记录）

使用 mysql的分页查询语句，需要两个参数，起始索引和最大记录数

计算：
起始索引：firstIndex=pageSize*(pageNum-1);
最大记录数：maxCount=pageSize；

注意：
1.sql中索引是从1开始的
2.两个参数都是由当前页码和最大记录数计算出来的，所以使用时只定义页码和记录数即可
3.第一页的参数为（0,3），不是说记录的起始索引从0开始，这只是一个参数，实际效果是
从第1条记录开始，记录数为3条，即查询1,2,3三条记录
4.第二页的参数为（3,3），不是说记录的起始索引从3开始，这只是一个参数，实际效果是
从第4条记录开始，记录数为3条，即查询4,5,6三条记录，后面以此类推·····

Mysql语句：
select * from 表名 limit 起始索引,最大记录数
------------------------------------------

Oracle分析：
//起始行号
firstRownum = pageSize*(pageNum-1)+1
//结束行号
endRownum = firstRownum+pageSize-1

具体计算：
firstRownum=3*(2-1)+1=4;
endRownum=4+3-1=6;
*/

--写Oracle的分页，从子查询写起，也就是说从 <= 写起，或者说从endRownum写起
SELECT ROWNUM ,t2.* FROM
(
SELECT ROWNUM r,t.* FROM emp t WHERE ROWNUM <=6
) t2 WHERE t2.r >=4;

------------------------------------------

--优化 --查询所有字段
SELECT * FROM
(
SELECT ROWNUM r,t.* FROM emp t WHERE ROWNUM <=6
)  WHERE r >=4;

--优化 -- 结果指定字段
SELECT empno,ename,job FROM  
(
SELECT ROWNUM r,t.* FROM emp t WHERE ROWNUM <=6
)  WHERE r >=4;

------------------------------------------

--需求：按照薪资的高低排序再分页
SELECT * FROM
(
SELECT ROWNUM r,t.* FROM emp t WHERE ROWNUM <=6 ORDER BY sal DESC
)  WHERE r >=4 ;

--先排序薪资，再分页
SELECT * FROM emp ORDER BY sal DESC;
SELECT * FROM
  (
  SELECT ROWNUM r,t.* FROM 
         (SELECT * FROM emp ORDER BY sal DESC) t
   WHERE ROWNUM <=6 ORDER BY sal DESC
  )    
WHERE r >=4 ;--Hibernate会自动将所有数据封装到实体对象（多余出来的行号那一列不会封装）

--如果不需要额外的字段，则只需要指定特定的列名就可以了。
--优化：子查询字段尽量少一些。数据量少。比如，表中有100个字段，但你就想显示5个，那么，你就子查询中直接指定5个就ok了。但使用orm框架的建议都查出来。
SELECT * FROM
  (
  SELECT ROWNUM r,t.* FROM 
         (SELECT ename,job,sal FROM emp ORDER BY sal DESC) t
   WHERE ROWNUM <=6 ORDER BY sal DESC
  )    
WHERE r >=4 ;

--通用查询代码
SELECT * FROM
  (
  SELECT ROWNUM r,t.* FROM 
         (SELECT ename,job,sal FROM emp ORDER BY sal DESC) t
   WHERE ROWNUM <=endRownum ORDER BY sal DESC
  )    
WHERE r >=firstRownum ;

/*
另外一种计算方法（索引算法）
firstIndex=pageSize*(pageNum-1);
endRownum=firstIndex+pageSize；
*/
SELECT * FROM
  (
  SELECT ROWNUM r,t.* FROM 
         (SELECT ename,job,sal FROM emp ORDER BY sal DESC) t
   WHERE ROWNUM <=endRownum ORDER BY sal DESC
  )    
WHERE r > firstIndex;--Hibernate的内置算法

分析原因：

rownum只能使用<、 <=，不能使用>、 >=符号，原因是：Oracle是基于行的数据库，行号永远是从1开始，即必须有第一行，才有第二行。

【提示】：

如何记忆编写Oracle的分页？建议写的时候从里到外来写，即先写小于的条件的子查询（过滤掉rownum大于指定值的数据），再写大于的条件的查询（过滤掉rownum小于的值）。

Oracle的分页中如果需要排序显示，要先排序操作,再分页操作。(再嵌套一个子查询)

性能优化方面:建议在最里层的子查询中就直接指定字段或者其他的条件，减少数据的处理量。

1.3. ROWID

ROWID（记录编号）：是表的伪列，是用来唯一标识表中的一条记录，并且间接给出了表行的物理位置，定位表行最快的方式。

主键:标识唯一的一条业务数据的标识。主键是给业务给用户用的。不是给数据库用的。

记录编号rowid：标识唯一的一条数据的。主要是给数据库用的。类似UUID。

1.3.1. ROWID的查看

SELECT t.*,ROWID FROM emp t;

注意：下面这种写法是错的

这两种写法可以：

1.3.2. ROWID的产生

使用insert语句插入数据时，oracle会自动生成rowid 并将其值与表数据一起存放到表行中。

这与rownum有很大不同，rownum不是表中原本的数据，只是在查询的时候才生成的。

提示：rownum默认的排序就是根据rowid

1.3.2. ROWID的作用

这里列举两个常见的应用：

去除重复数据。-- 在plsql Developer工具中，加上rowid可以更改数据。

关于主键和rowid的区别：

相同点：为了标识唯一一条记录的。

不同点：主键：针对业务数据，用来标识不同的一条业务数据。

　　　 rowid：针对具体数据的，用来标识不同的唯一的一条数据，跟业务无关。

【示例】需求：删除表中的重复数据，要求保留重复记录中最早插入的那条。（DBA面试题）

--查看rowid
SELECT t.*,ROWID FROM emp t;

--需求：删除表中的重复数据，要求保留重复记录中最早插入的那条。（DBA面试题）
--准备测试表和测试数据：
--参考建表语句如下：
-- Create table
create table test
(
  id   number,
  name varchar2(50)
);

--插入测试数据
INSERT INTO TEST VALUES(1,'xiaoming');
INSERT INTO TEST VALUES(2,'xiaoming');
INSERT INTO TEST VALUES(3,'xiaoming');
COMMIT;
SELECT * FROM TEST ;

--通过rowid，剔除重复xiaoming，保留最早插入的xiaoming
SELECT t.*,ROWID FROM TEST t;

--删除的的时候，可以先查询你要删除的东东
SELECT  t.*,ROWID FROM TEST t WHERE ROWID > (SELECT MIN(ROWID) FROM TEST);
DELETE FROM TEST t WHERE ROWID > (SELECT MIN(ROWID) FROM TEST);

--语句有缺点：条件不足，会只保留一条数据，误删其他数据
--重新插入测试数据
INSERT INTO TEST VALUES(1,'xiaoming');
INSERT INTO TEST VALUES(2,'xiaoming');
INSERT INTO TEST VALUES(3,'xiaoming');
INSERT INTO TEST VALUES(4,'Rose');
INSERT INTO TEST VALUES(5,'Rose');
COMMIT;

--剔除重复数据
SELECT * FROM TEST WHERE ROWID NOT in(SELECT MIN(ROWID) FROM TEST GROUP BY NAME);
DELETE TEST WHERE ROWID NOT in(SELECT MIN(ROWID) FROM TEST GROUP BY NAME);

注意:删除重复记录一定要小心,万一你的条件有问题,就会删错数据.建议删除之前，可以先用查询查一下，看是否是目标数据。

数据一旦删除恢复比较麻烦，但可以恢复，采用日志回滚。一般不要轻易用。