sql中的行列转换

最近在研究行列转换。在2000版本中,一律用case 语句来完成,但是在2005中新增了pivot运算符,它让你能够将行级数据旋转成为列表数据,实现类似Excel数据透视表的功能,而不需要像先前版本的SQLServer一样使用CASE语句。

以下是从别人的博客上抄下来的,很有参考价值:


代码
 /*  
 标题:普通行列转换(version 2.0)  
 作者:爱新觉罗.毓华(十八年风雨,守得冰山雪莲花开)  
 时间:2008-03-09  
 地点:广东深圳  
 说明:普通行列转换(version 1.0)仅针对sql server 2000提供静态和动态写法,version 2.0增加sql server 2005的有关写法。  
   
 问题:假设有张学生成绩表(tb)如下:  
 姓名 课程 分数  
 张三 语文 74  
 张三 数学 83  
 张三 物理 93  
 李四 语文 74  
 李四 数学 84  
 李四 物理 94  
 想变成(得到如下结果):   
 姓名 语文 数学 物理   
 ---- ---- ---- ----  
 李四 74   84   94  
 张三 74   83   93  
 -------------------  
 
*/  
   
 
create table tb(姓名 varchar(10) , 课程 varchar(10) , 分数 int)  
 
insert into tb values('张三' , '语文' , 74)  
 
insert into tb values('张三' , '数学' , 83)  
 
insert into tb values('张三' , '物理' , 93)  
 
insert into tb values('李四' , '语文' , 74)  
 
insert into tb values('李四' , '数学' , 84)  
 
insert into tb values('李四' , '物理' , 94)  
 
go  
   
 
--SQL SERVER 2000 静态SQL,指课程只有语文、数学、物理这三门课程。(以下同)  
 select 姓名 as 姓名 ,  
   
max(case 课程 when '语文' then 分数 else 0 end) 语文,  
   
max(case 课程 when '数学' then 分数 else 0 end) 数学,  
   
max(case 课程 when '物理' then 分数 else 0 end) 物理  
 
from tb  
 
group by 姓名  
   
 
--SQL SERVER 2000 动态SQL,指课程不止语文、数学、物理这三门课程。(以下同)  
 declare @sql varchar(8000)  
 
set @sql = 'select 姓名 '  
 
select @sql = @sql + ' , max(case 课程 when ''' + 课程 + ''' then 分数 else 0 end) [' + 课程 + ']'  
 
from (select distinct 课程 from tb) as a  
 
set @sql = @sql + ' from tb group by 姓名'  
 
exec(@sql)   
   
 
--SQL SERVER 2005 静态SQL。  
 select * from (select * from tb) a pivot (max(分数) for 课程 in (语文,数学,物理)) b  
   
 
--SQL SERVER 2005 动态SQL。  
 declare @sql varchar(8000)  
 
select @sql = isnull(@sql + '],[' , ''+ 课程 from tb group by 课程  
 
set @sql = '[' + @sql + ']'  
 
exec ('select * from (select * from tb) a pivot (max(分数) for 课程 in (' + @sql + ')) b')  
   
 
---------------------------------  
   
 
/*  
 问题:在上述结果的基础上加平均分,总分,得到如下结果:  
 姓名 语文 数学 物理 平均分 总分   
 ---- ---- ---- ---- ------ ----  
 李四 74   84   94   84.00  252  
 张三 74   83   93   83.33  250  
 
*/  
   
 
--SQL SERVER 2000 静态SQL。  
 select 姓名 姓名,  
   
max(case 课程 when '语文' then 分数 else 0 end) 语文,  
   
max(case 课程 when '数学' then 分数 else 0 end) 数学,  
   
max(case 课程 when '物理' then 分数 else 0 end) 物理,  
   
cast(avg(分数*1.0as decimal(18,2)) 平均分,  
   
sum(分数) 总分  
 
from tb  
 
group by 姓名  
   
 
--SQL SERVER 2000 动态SQL。  
 declare @sql varchar(8000)  
 
set @sql = 'select 姓名 '  
 
select @sql = @sql + ' , max(case 课程 when ''' + 课程 + ''' then 分数 else 0 end) [' + 课程 + ']'  
 
from (select distinct 课程 from tb) as a  
 
set @sql = @sql + ' , cast(avg(分数*1.0) as decimal(18,2)) 平均分 , sum(分数) 总分 from tb group by 姓名'  
 
exec(@sql)   
   
 
--SQL SERVER 2005 静态SQL。  
 select m.* , n.平均分 , n.总分 from  
 (
select * from (select * from tb) a pivot (max(分数) for 课程 in (语文,数学,物理)) b) m,  
 (
select 姓名 , cast(avg(分数*1.0as decimal(18,2)) 平均分 , sum(分数) 总分 from tb group by 姓名) n  
 
where m.姓名 = n.姓名  
   
 
--SQL SERVER 2005 动态SQL。  
 declare @sql varchar(8000)  
 
select @sql = isnull(@sql + ',' , ''+ 课程 from tb group by 课程  
 
exec ('select m.* , n.平均分 , n.总分 from  
 (select * from (select * from tb) a pivot (max(分数) for 课程 in (
' + @sql + ')) b) m ,   
 (select 姓名 , cast(avg(分数*1.0) as decimal(18,2)) 平均分 , sum(分数) 总分 from tb group by 姓名) n  
 where m.姓名 = n.姓名
')  
   
 
drop table tb      
   
 
------------------  
 ------------------  
   
 
/*  
 问题:如果上述两表互相换一下:即表结构和数据为:  
 姓名 语文 数学 物理  
 张三 74  83  93  
 李四 74  84  94  
 想变成(得到如下结果):   
 姓名 课程 分数   
 ---- ---- ----  
 李四 语文 74  
 李四 数学 84  
 李四 物理 94  
 张三 语文 74  
 张三 数学 83  
 张三 物理 93  
 --------------  
 
*/  
   
 
create table tb(姓名 varchar(10) , 语文 int , 数学 int , 物理 int)  
 
insert into tb values('张三',74,83,93)  
 
insert into tb values('李四',74,84,94)  
 
go  
   
 
--SQL SERVER 2000 静态SQL。  
 select * from  
 (  
  
select 姓名 , 课程 = '语文' , 分数 = 语文 from tb   
  
union all  
  
select 姓名 , 课程 = '数学' , 分数 = 数学 from tb  
  
union all  
  
select 姓名 , 课程 = '物理' , 分数 = 物理 from tb  
 ) t  
 
order by 姓名 , case 课程 when '语文' then 1 when '数学' then 2 when '物理' then 3 end  
   
 
--SQL SERVER 2000 动态SQL。  
 --调用系统表动态生态。  
 declare @sql varchar(8000)  
 
select @sql = isnull(@sql + ' union all ' , '' ) + ' select 姓名 , [课程] = ' + quotename(Name , ''''+ ' , [分数] = ' + quotename(Name) + ' from tb'  
 
from syscolumns   
 
where name! = N'姓名' and ID = object_id('tb'--表名tb,不包含列名为姓名的其它列  
 order by colid asc  
 
exec(@sql + ' order by 姓名 ')  
   
 
--SQL SERVER 2005 动态SQL。  
 select 姓名 , 课程 , 分数 from tb unpivot (分数 for 课程 in([语文] , [数学] , [物理])) t  
   
 
--SQL SERVER 2005 动态SQL,同SQL SERVER 2000 动态SQL。  
   
 
--------------------  
 /*  
 问题:在上述的结果上加个平均分,总分,得到如下结果:  
 姓名 课程   分数  
 ---- ------ ------  
 李四 语文   74.00  
 李四 数学   84.00  
 李四 物理   94.00  
 李四 平均分 84.00  
 李四 总分   252.00  
 张三 语文   74.00  
 张三 数学   83.00  
 张三 物理   93.00  
 张三 平均分 83.33  
 张三 总分   250.00  
 ------------------  
 
*/  
   
 
select * from  
 (  
  
select 姓名 as 姓名 , 课程 = '语文' , 分数 = 语文 from tb   
  
union all  
  
select 姓名 as 姓名 , 课程 = '数学' , 分数 = 数学 from tb  
  
union all  
  
select 姓名 as 姓名 , 课程 = '物理' , 分数 = 物理 from tb  
  
union all  
  
select 姓名 as 姓名 , 课程 = '平均分' , 分数 = cast((语文 + 数学 + 物理)*1.0/3 as decimal(18,2)) from tb  
  
union all  
  
select 姓名 as 姓名 , 课程 = '总分' , 分数 = 语文 + 数学 + 物理 from tb  
 ) t  
 
order by 姓名 , case 课程 when '语文' then 1 when '数学' then 2 when '物理' then 3 when '平均分' then 4 when '总分' then 5 end  
 
drop table tb 


语法规则
<pivot_clause> ::=
        ( aggregate_function ( value_column )
        FOR pivot_column
        IN ( <column_list> )
    )
<unpivot_clause> ::=
        ( value_column FOR pivot_column IN ( <column_list> ) )

table_source PIVOT <pivot_clause>
指定基于 table_source 对 pivot_column 进行透视。table_source 是表或表表达式。输出是包含 table_source 中 pivot_column 和 value_column 列之外的所有列的表。table_source 中 pivot_column 和 value_column 列之外的列被称为透视运算符的组合列。
PIVOT 对输入表执行组合列的分组操作,并为每个组返回一行。此外,input_table 的 pivot_column 中显示的 column_list 中指定的每个值,输出中都对应一列。
有关详细信息,请参阅“备注”部分和使用 PIVOT 和 UNPIVOT。
aggregate_function
系统或用户定义的聚合函数。聚合函数应该对空值固定不变。对空值固定不变的聚合函数在求聚合值时不考虑组中的空值。
不允许使用 COUNT(*) 系统聚合函数。
value_column
PIVOT 运算符的值列。与 UNPIVOT 一起使用时,value_column 不能是输入 table_source 中的现有列的名称。
FOR pivot_column
PIVOT 运算符的透视列。pivot_column 必须属于可隐式或显式转换为 nvarchar() 的类型。此列不能为 image 或 rowversion。
使用 UNPIVOT 时,pivot_column 是从 table_source 中提取的输出列的名称。table_source 中不能有该名称的现有列。
IN ( column_list )
在 PIVOT 子句中,列出 pivot_column 中将成为输出表的列名的值。该列表不能指定被透视的输入 table_source 中已存在的任何列名。
在 UNPIVOT 子句中,列出 table_source 中将被提取到单个 pivot_column 中的列。

在这里有两点需要说明:

1.在语法规则的table_source处要写成select * from xxx,用*而不是具列名。反正我在测试的时候用*能通过,用具体列名无法通过。

2.在语法规则的<column_list>处,要写成常量,也就是具体的字符串,如:(北京,上海,武汉),而不能写成select语句。

以上是大概的了解,到了具体项目中再来具体研究吧。

参考的文章:

Pivot Table 实现详解(一)

http://www.cnblogs.com/Chinasf/archive/2008/04/13/1151368.html

SQL Server 2005 中行列转换(Pivot 和 UNPivot的使用)

http://www.cnblogs.com/talantlee/articles/561745.html

PIVOT 在 SQL Server 2005/2008 上的应用

http://www.cnblogs.com/Nettech/articles/1340214.html

普通行列转换

http://blog.csdn.net/chenjianyong94/archive/2009/05/06/4155420.aspx

原文地址:https://www.cnblogs.com/ljzforever/p/1681451.html