SqlServer 垂直分表

当单表数据太多时。我们能够水平划分,參考 SqlServer 分区视图实现水平分表 ,水平划分能够提高表的一些性能。

而 垂直分表 则相对非常少见到和用到,由于这可能是数据库设计上的问题了。假设数据库中一张表有部分字段差点儿从不不更改但常常查询,而部分字段的数据频繁更改。这样的设计放到同一个表中就不合理了,相互影响太大了。在已存在改情况的表的时候,能够考虑按列拆分表,即垂直拆分。


由于垂直分表的案例比較少,近期由于存在这种表,所以个人捣鼓了一下。


源表设计结构:

--  源表
CREATE TABLE [dbo].[DemoTab](
[Guid] [uniqueidentifier] NOT NULL,
[UserName] [nvarchar](30) NOT NULL,
[Password] [nvarchar](30) NOT NULL,
[UserAccount] [varchar](30) NOT NULL,
[Amount] [numeric](18, 4) NULL,
CONSTRAINT [PK_DemoTab] PRIMARY KEY CLUSTERED ([Guid])
)
GO


ALTER TABLE [dbo].[DemoTab] 
ADD CONSTRAINT [DF_DemoTab_Guid] DEFAULT (newsequentialid()) FOR [Guid]
GO

--  原来是訪问视图的(优点就是视图层不变)
CREATE VIEW [dbo].[VDemoTab]
AS
SELECT [Guid],[UserName],[Password],[UserAccount],[Amount]
FROM [dbo].[DemoTab]
GO

注:拆分后各表的主键都是同样了。并且拆分后的表是规范化的。


如今拆成两张表:

注意选择一张表作为基表,其它表都有与该表的外键。

--  分表【1】,以该表为"主表",其它拆分出的表为"子表"
CREATE TABLE [dbo].[DemoTab001](
[Guid] [uniqueidentifier] NOT NULL,
[UserName] [nvarchar](30) NOT NULL,
[Password] [nvarchar](30) NOT NULL,
CONSTRAINT [PK_DemoTab001] PRIMARY KEY CLUSTERED ([Guid])
)
GO

--  主键默认值能够不须要,由于插入数据前须要确定主键值
--ALTER TABLE [dbo].[DemoTab001] 
--ADD CONSTRAINT [DF_DemoTab001_Guid] DEFAULT (newsequentialid()) FOR [Guid]
--GO

--  分表【2】,"子表"
CREATE TABLE [dbo].[DemoTab002](
[Guid] [uniqueidentifier] NOT NULL,
[UserAccount] [varchar](30) NOT NULL,
[Amount] [numeric](18, 4) NULL,
CONSTRAINT [PK_DemoTab002] PRIMARY KEY CLUSTERED ([Guid])
)
GO

--  主键默认值能够不须要,由于插入数据前须要确定主键值
--ALTER TABLE [dbo].[DemoTab002] 
--ADD CONSTRAINT [DF_DemoTab002_Guid] DEFAULT (newsequentialid()) FOR [Guid]
--GO


--  若主表变更主键则级联更新或删除(主键一般是不更新的,也可省去 ON UPDATE CASCADE)
ALTER TABLE [dbo].[DemoTab002] 
ADD CONSTRAINT [FK_DemoTab002_DemoTab001_Guid] FOREIGN KEY ([Guid]) 
REFERENCES [DemoTab001]([Guid]) ON UPDATE CASCADE ON DELETE CASCADE
GO


假设之前是对单个表或者视图操作。拆分之后逻辑层修改可能非常多。为保持修改最小,能够用联合视图操作。怎么连接表依个人情况而定。


--  拆分后使用联合视图(INNER JOIN 也能够)
ALTER VIEW [dbo].[VDemoTab]
AS
SELECT T1.[Guid],T1.[UserName],T1.[Password],T2.[UserAccount],T2.[Amount]
FROM [dbo].[DemoTab001] T1 LEFT JOIN [dbo].[DemoTab002] T2 ON T1.[Guid]=T2.[Guid]
GO


这时问题来了,要对表进行DML操作。insert , update , delete 怎么解决?由于要求主键是分散在多个表而且是同样的。

这时仅仅能用考虑触发器来保证一致性了,触发器则定义在视图上,使用的是 INSTEAD OF 类型的触发器。



insert 触发器:

视图 [VDemoTab] 中的 [Guid] 为表 插入时值。在插入触发器中,虚拟表[inserted]的[Guid]是唯一的。所以在触发器中能够同一时候使用该 [Guid] 插入到多个分表中,保证了多个分表的[Guid]是同样的。

--  insert 触发器
CREATE TRIGGER [dbo].[tgr_VDemoTab_insert]
ON [dbo].[VDemoTab] 
INSTEAD OF INSERT
AS 
BEGIN
 INSERT INTO [dbo].[DemoTab001]([Guid],[UserName],[Password])
 SELECT [Guid],[UserName],[Password] FROM inserted;
 
 INSERT INTO [dbo].[DemoTab002]([Guid],[UserAccount],[Amount])
 SELECT [Guid],[UserAccount],[Amount] FROM inserted;
END
GO

update 触发器:

同理,更新时涉及虚拟表 deleted 和 inserted,而更新是对视图[VDemoTab]更新的,所以虚拟表inserted包含了全部的字段,所以须要触发器分别更新多个分表。

--  update 触发器
CREATE TRIGGER [dbo].[tgr_VDemoTab_update]  
ON [dbo].[VDemoTab]   
INSTEAD OF UPDATE  
AS
BEGIN
 UPDATE T1 SET 
 T1.[UserName] = T2.[UserName], 
 T1.[Password] = T2.[Password]
 FROM [dbo].[DemoTab001] AS T1, inserted AS T2 WHERE T1.[Guid] = T2.[Guid] 

 UPDATE T1 SET 
 T1.[UserAccount] = T2.[UserAccount], 
 T1.[Amount] = T2.[Amount]
 FROM [dbo].[DemoTab002] AS T1, inserted AS T2 WHERE T1.[Guid] = T2.[Guid] 
END
GO

delete 触发器:

删除视图[VDemoTab]记录,涉及多个表则不同意删除,因此仅仅要删除"主表"的记录就可以。其它分表都会级联删除。


--  delete 触发器
CREATE TRIGGER [dbo].[tgr_VDemoTab_delete]  
ON [dbo].[VDemoTab]   
INSTEAD OF DELETE  
AS
BEGIN
    DELETE FROM [dbo].[DemoTab001]
    WHERE [Guid] IN (SELECT [Guid] FROM deleted)
END
GO


设计基本就完毕了,如今进行測试。

INSERT INTO [dbo].[VDemoTab]([Guid],[UserName],[Password],[UserAccount],[Amount])
SELECT NEWID(),'user01','pw01','account01',100
UNION ALL
SELECT NEWID(),'user02','pw02','account02',99
UNION ALL
SELECT NEWID(),'user03','pw03','account03',0
GO

UPDATE [VDemoTab] SET [Password]='pw',[Amount]='10'
WHERE [Amount] >=0 AND [Amount]<100 AND [UserName] LIKE '%3'
GO

DELETE FROM [VDemoTab] WHERE [UserName] = 'user03'
GO

SELECT * FROM [dbo].[DemoTab001] 
SELECT * FROM [dbo].[DemoTab002] 
SELECT * FROM [dbo].[VDemoTab]

基本操作都是正常的!垂直分表完毕!


性能怎么样呢?

因为 Guid 作为主键,使用的是 NEWID() 而不是  NEWSEQUENTIALID(),新增记录时聚集索引都可能又一次排序较多数据。


分表之后,单个数据页能存储的数据很多其它了,可是分成多个表中,数据页也增多了,同一时候 Guid 在每一个表都存在,所以查询数据时IO会很多其它。


对于更新数据。在触发器中是两个表同一时候更新的。即使更新当中一个分表,其它分表都会影响。

假设分表之后不同一时候更新。能够在触发器中使用 if(update(col)) 来推断更新的是那一列,就更新对应的基表即可,其它分表不更新。


最好的情况就是,拆分后的表都是“独立”的。不用联合视图,查询和更改都独立,这须要更改逻辑层。


本文出自“Hello.KK (SQL Server)”的博客,转载请务必保留此出处http://blog.csdn.net/kk185800961/article/details/46740315

原文地址:https://www.cnblogs.com/yfceshi/p/7242000.html