常用的数据分页技术总结

根据2个博文的总结

常用的数据分页技术总结：http://www.cnblogs.com/refactor/archive/2012/06/28/2552700.html

网上搜集的几种数据分页的总结 http://www.cnblogs.com/kingboy2008/archive/2011/06/22/2086710.html

http://www.cnblogs.com/builderman/archive/2011/07/19/2110108.html

1.数据分页概述　　

• 通常在Web页面中，在数据量比较大时，无法在一个页面中显示所有数据　　

• 在某些特定场景下，并不需要返回所有满足条件的数据　　

• 从数据的角度看，需要返回指定范围内的数据

2.数据层分页技术　　

• 在数据库查询时，只查询特定页面的数据　　

• 主要由T -SQL来完成　　

• 适用于比较大的数据表　　

• 优点：返回的结果集小，查询速度快　　

• 缺点：需要多次查询数据库

3.数据层分页技术－使用临时表

• 在查询数据前，创建一个临时表　　

• 表的列比要返回的结果集多一个标识列　　

• 按照特定列排序，将结果插入到临时表中　　

• 此时，可以按照标识列返回特定页面

View Code

CREATE PROCEDURE paging2
 
 @pageNum INT
 
,@Num INT
 
AS
 
BEGIN
 
SELECT  AddressLine1,AddressLine2,City,PostalCode,IDENTITY(int) Num INTO #temp 
FROM Person.Address ORDER BY AddressID ASC 

SELECT * FROM #temp WHERE  Num<=@Num*@pageNum AND Num> @Num*(@pageNum-1)
 
ORDER BY Num ASC
 
DROP TABLE #temp
 
END
EXEC paging2 20,5;--每页五条，第二十页数据 耗时： 1s
 
EXEC paging0 20000,5;--每页五条，第二万页数据 耗时: 1s
 
EXEC paging0 200000,5;--每页五条，第二十万页数据 耗时： 1s

4.数据层分页技术－使用表变量　　

• 在查询数据前，创建一个表变量　　

• 表的列比要返回的结果集多一个标识列　　

• 按照特定列排序，将结果插入到表变量中　　

• 此时，可以按照标识列返回特定页面

5.数据层分页技术－反复取Top　　　　

• 若要按特定列正排序取第91－100 行数据　　

• 首先，按特定列正排序取Top 100 　　

• 然后，反向排序取Top 10 　　

• 最后，再将结果正排序后返回

create PROCEDURE fenye
 (
 @pageNum INT 
 
 ,@Num INT    
 )
AS
 
BEGIN
 
SELECT * from (SELECT TOP (@Num) *  FROM 
(SELECT TOP (@Num*@pageNum) * FROM Person.Address ORDER BY AddressID asc) b ORDER BY b.AddressID desc
 )c ORDER BY c.AddressID asc
END 

这个中方法先把数据库中的前@Num*@pageNum条数据取出，再从结果集中取出最后的@Num条数据，当然两个排序规则是不一样的这点很重要，不然起不到分页效果。 你可以具体试一下就明白了。缺点在于获取的页数越多就越慢
 
看性能
EXEC paging1 2,5;--每页五条，第十页数据 耗时：1s
 
EXEC paging1 200,5;--每页五条，第200页数据 耗时：1s
 
EXEC paging1 20000,5;--每页五条，第20000页数据 耗时：1s
 
EXEC paging1 200000,5;--每页五条，第二十万页数据 耗时： 3s

6.数据层分页技术－使用行号　　

• 在SQL Server 2005/2008中　　

• 查询结果集时，添加一个ROW NUMBER() 表示行号　(不懂ROW NUMBER()：详见：http://www.cnblogs.com/fxgachiever/archive/2010/09/15/1826792.html)　

• 将上述结果集作为子查询，通过ROW_NUMBER() 筛选出特定页面

View Code

 之所以要改进第三种方式那是因为，Top关键字其实是
 
已经经过性能优化了的之所以比不过ROW_NUMBER()的执行效率是因为用了两次，那么既然如此，我们何不将二者结合起来使用，效果岂不更佳。那就让我们改进一下吧。
 
 
 
CREATE PROCEDURE paging0 

@pageNum INT
 
,@Num INT
 
AS 

begin
 
SELECT * FROM 

(
 
SELECT TOP (@Num*@pageNum)  measurePipe,measureTime,measureCycle,MeasureData,
 
          doseRateValue,ROW_NUMBER() OVER(ORDER BY GMpipe.measureTime ASC ) AS NUM 

FROM GMpipe)A
 
WHERE A.NUM> @Num*(@pageNum-1) ORDER BY A.measureTime desc
 
END
 
Go
 
看性能
EXEC paging0 20,5;--每页五条，第二十页数据 耗时： 1s
 
EXEC paging0 20000,5;--每页五条，第二万页数据 耗时: 1s
 
EXEC paging0 200000,5;--每页五条，第二十万页数据 耗时： 1s

7.代码如下:

View Code 

USE AdventureWorks2008
GO
SELECT COUNT(*) FROM Production.TransactionHistoryArchive
GO
SELECT TOP 50 * FROM Production.TransactionHistoryArchive
ORDER BY ReferenceOrderID ASC
GO

--Use Top*Top
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();

DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;
SET @Sql='SELECT T2.* FROM (
    SELECT TOP 10 T1.* FROM 
        (SELECT TOP ' + STR(@PageNumber*@Count) +' * FROM Production.TransactionHistoryArchive
        ORDER BY ReferenceOrderID ASC) AS T1
    ORDER BY ReferenceOrderID DESC) AS T2
ORDER BY ReferenceOrderID ASC';
EXEC (@sql);

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

--USE table value
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();
DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;

DECLARE @local_variable table (RowNumber int identity(1,1),[TransactionID] [int],
    [ProductID] [int],
    [ReferenceOrderID] [int],
    [ReferenceOrderLineID] [int],
    [TransactionDate] [datetime],
    [TransactionType] [nchar](1),
    [Quantity] [int],
    [ActualCost] [money],
    [ModifiedDate] [datetime]);
insert into @local_variable (TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate) 
SELECT TOP 50000 TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate from Production.TransactionHistoryArchive ORDER BY ReferenceOrderID ASC
select * from @local_variable where RowNumber > (@PageNumber-1)*@Count and RowNumber <= @PageNumber*@Count

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

--USE temp table
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();
DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;

create table #local_variable(RowNumber int identity(1,1),[TransactionID] [int],
    [ProductID] [int],
    [ReferenceOrderID] [int],
    [ReferenceOrderLineID] [int],
    [TransactionDate] [datetime],
    [TransactionType] [nchar](1),
    [Quantity] [int],
    [ActualCost] [money],
    [ModifiedDate] [datetime]);
insert into #local_variable (TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate) 
SELECT TOP 50000 TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate from Production.TransactionHistoryArchive ORDER BY ReferenceOrderID ASC
select * from #local_variable where RowNumber > (@PageNumber-1)*@Count and RowNumber <= @PageNumber*@Count

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

--Use ROW_NUMBER
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();

DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;
SELECT * FROM 
(    SELECT ROW_NUMBER()  
      OVER(ORDER BY ReferenceOrderID) AS RowNumber,    
      *
    FROM Production.TransactionHistoryArchive) AS T
WHERE T.RowNumber<=@PageNumber*@Count AND T.RowNumber>(@PageNumber-1)*@Count;

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

8.应用层分页技术（自定义分页方法）　　

• 在应用层/逻辑层缓存数据，并进行数据的分段显示　　

• 主要由程序代码完成　　

• 优点：查询数据库次数少，每次返回结果快　　

• 缺点：第一次查询慢，占用应用层内存资源

9.应用层分页技术－GridView 　　

• 应用GridView的分页功能　　

• 启用XxxDataSource 控件的缓存功能

10.应用层分页技术－DataPager 　　

• .NET 3.5 当中的新控件　　

• 更加灵活定义分页格式

11.应用层分页技术－PagedDataSource 对象分页　　

• .NET 当中的对象　　

• 更加灵活定义分页格式，但是代码量特多，不好控制

12.应用层分页技术－LINQ 　　

• 自定义数据绑定　　

• 使用LINQ 进行查询　　

• 使用Skip() 和Take() 函数

12.展现层分页技术（JS,jquery组合成的第三方View控件）　

• 在客户端进行数据分页　　

• 主要通过客户端脚本来实现　　

• 优点：减少网络传输量，提高带宽利用率　　

• 缺点：需要编写大量客户端脚本，增加开发与维护成本

13.展现层分页技术－UpdatePanel 　　

• 通过ASP.NET AJAX 中的UpdatePanel 控件，可以将应用层所提供的分页功能转换到客户端　　

• 无需维护代码　　

• 充分利用服务器端控件功能

14.展现层分页技术－Data Services 　　

• 使用Data Services所提供的基于URI 的数据访问，可以实现数据分页　　

• 在展现层，可以直接通过Javascript 进行解析　　

• 轻量级数据传输格式：XML/JSON

总结

我们再来改变一下每页的条数看看

临时表方式：

EXEC paging2 5000,200;--每页两百条，第五千页数据耗时：7s

Top语句方式：

EXEC paging1 5000,200;-- 每页两百条，第五千页数据耗时： 3s

ROW_NUMBER()函数方式：

EXEC paging0 5000,200;--每页五条，第二十万页数据耗时：1s

另外的SQL分页

SQL Server 存储过程的分页，这个问题已经讨论过几年了，很多朋友在问我，所以在此发表一下我的观点建立表：

CREATE TABLE [TestTable] ( [ID] [int] IDENTITY (1, 1) NOT NULL , [FirstName] [nvarchar] (100) COLLATE Chinese_PRC_CI_AS NULL , [LastName] [nvarchar] (100) COLLATE Chinese_PRC_CI_AS NULL , [Country] [nvarchar] (50) COLLATE Chinese_PRC_CI_AS NULL , [Note] [nvarchar] (2000) COLLATE Chinese_PRC_CI_AS NULL ) ON [PRIMARY] GO

插入数据：(2万条，用更多的数据测试会明显一些) SET IDENTITY_INSERT TestTable ON

declare @i int set @i=1 while @i<=20000 begin insert into TestTable([id], FirstName, LastName, Country,Note) values(@i, 'FirstName_XXX','LastName_XXX','Country_XXX','Note_XXX') set @i=@i+1 end

SET IDENTITY_INSERT TestTable OFF

-------------------------------------

分页方案一：(利用Not In和SELECT TOP分页) 语句形式：

SELECT TOP 10 * FROM TestTable WHERE (ID NOT IN

(SELECT TOP 20 id FROM TestTable ORDER BY id)) ORDER BY ID

格式形式：

SELECT TOP 页大小 * FROM TestTable WHERE (ID NOT IN

(SELECT TOP 页大小*页数 id-1 FROM 表 ORDER BY id)) ORDER BY ID

-------------------------------------

分页方案二：(利用ID大于多少和SELECT TOP分页）语句形式：

SELECT TOP 10 * FROM TestTable WHERE (ID >

(SELECT MAX(id) FROM (SELECT TOP 20 id FROM TestTable ORDER BY id) AS T)) ORDER BY ID

格式形式：

SELECT TOP 页大小 * FROM TestTable WHERE (ID > (SELECT MAX(id)

FROM (SELECT TOP 页大小*页数 id-1 FROM 表 ORDER BY id) AS T)) ORDER BY ID

-------------------------------------

分页方案三：(利用SQL的游标存储过程分页)

create procedure XiaoZhengGe @sqlstr nvarchar(4000), --查询字符串

@currentpage int, --第N页

@pagesize int --每页行数

set nocount on

declare @P1 int, --P1是游标的id

@rowcount int exec sp_cursoropen

@P1 output,@sqlstr,@scrollopt=1,

@ccopt=1,@rowcount=@rowcount output select ceiling(1.0*@rowcount/@pagesize) as 总页数--,@rowcount as 总行数,@currentpage as 当前页 set @currentpage=(@currentpage-1)*@pagesize+1 exec sp_cursorfetch @P1,16,@currentpage,@pagesize exec sp_cursorclose @P1 set nocount off

其它的方案：

如果没有主键，可以用临时表，也可以用方案三做，但是效率会低。建议优化的时候，加上主键和索引，查询效率会提高。

通过SQL 查询分析器，显示比较：

我的结论是:

分页方案二：(利用ID大于多少和SELECT TOP分页）效率最高，需要拼接SQL语句

分页方案一：(利用Not In和SELECT TOP分页) 效率次之，需要拼接SQL语句

分页方案三：(利用SQL的游标存储过程分页) 效率最差，但是最为通用

在实际情况中，要具体分析。