下面的查询从Address
表中获取不同的邮政编码大约需要 4 分 42 秒。Address
表中有 1,006,699 条记录。 表的复合键为 Address1, Address2, City, ZipCode
。
有时查询需要 5 秒才能运行,甚至需要 1 秒。
如何提高查询性能?
下面是 SQL 查询:
SELECT DISTINCT ZipCode FROM Address
下面是该表的架构:
CREATE TABLE [dbo].[Address]
(
[AddressID] [INT] IDENTITY(1,1) NOT NULL,
[Address1] [NVARCHAR](1000) NOT NULL,
[Address2] [NVARCHAR](1000) NOT NULL,
[City] [NVARCHAR](1000) NOT NULL,
[StateCd] [NVARCHAR](2) NULL,
[ZipCode] [NVARCHAR](10) NOT NULL,
PRIMARY KEY CLUSTERED
([Address1] ASC, [Address2] ASC, [City] ASC, [ZipCode] ASC)
) ON [PRIMARY]
GO
ALTER TABLE [dbo].[Address] ADD DEFAULT ('') FOR [Address2]
GO
我似乎无法添加执行计划的图像。
对于此查询:
SELECT DISTINCT ZipCode FROM Address
您希望在ZipCode
或至少ZipCode
是第一列的位置上有一个索引:
create index idx_address_zipcode on address(zipcode);
生成的执行计划应该是索引的扫描,这比处理原始表(以及聚合以获取不同的邮政编码)要快得多。
您还可以将现有索引更改为 (zipcode, city, address1, address2)
。 这使得索引更有用(在我看来),因为zipcode
更有可能用于过滤而不是address1
。 但是,该指数仅在 zipcode
上大于 1。
为了获得最佳性能,您可以创建一个索引视图,以便具体化聚合:
CREATE VIEW vw_Address_ZipCode
WITH SCHEMABINDING
AS
SELECT ZipCode, COUNT_BIG(*) AS ZipCodeCount
FROM dbo.Address
GROUP BY ZipCode;
GO
CREATE UNIQUE CLUSTERED INDEX cdx ON dbo.vw_Address_ZipCode(ZipCode);
GO
如果您使用的是企业版,优化程序可以考虑索引视图,而无需直接引用该视图:
SELECT DISTINCT ZipCode FROM Address;
在较小的版本中,您需要查询视图并添加NOEXPAND
查询提示,以便考虑对索引进行优化:
SELECT DISTINCT ZipCode FROM dbo.vw_Address_ZipCode WITH(NOEXPAND);
有关索引视图要求,请参阅文档。
1.如果可能,将ZipCode
数据类型从 nvarchar
转换为 bigint
。
2.尝试按ZipCode
分组
SELECT ZipCode FROM Address GROUP BY ZipCode;