SQLServer索引有哪些性能問(wèn)題?
??在良好的數據庫設計基礎上,能有效地使用索引是Server取得高性能的基礎,SQL Server采用基于代價(jià)的優(yōu)化模型,它對每一個(gè)提交的有關(guān)表的查詢(xún),決定是否使用索引或用哪一個(gè)索引。因為查詢(xún)執行的大部分開(kāi)銷(xiāo)是磁盤(pán)I/O,使用索引提高性能的一個(gè)主要目標是避免全表掃描,因為全表掃描需要從磁盤(pán)上讀表的每一個(gè)數據頁(yè),如果有索引指向數據值,則查詢(xún)只需讀幾次磁盤(pán)就可以了。
??所以如果建立了合理的索引,優(yōu)化器就能利用索引加速數據的查詢(xún)過(guò)程。但是,索引并不總是提高系統的性能,在增、刪、改操作中索引的存在會(huì )增加一定的工作量,因此,在適當的地方增加適當的索引并從不合理的地方刪除次優(yōu)的索引,將有助于優(yōu)化那些性能較差的SQL Server應用。
??實(shí)踐表明,合理的索引設計是建立在對各種查詢(xún)的分析和預測上的,只有正確地使索引與程序結合起來(lái),才能產(chǎn)生最佳的優(yōu)化方案。本文就SQL Server索引的性能問(wèn)題進(jìn)行了一些分析和實(shí)踐。
一、聚簇索引(clustered indexes)的使用
聚簇索引是一種對磁盤(pán)上實(shí)際數據重新組織以按指定的一個(gè)或多個(gè)列的值排序。
??由于聚簇索引的索引頁(yè)面指針指向數據頁(yè)面,所以使用聚簇索引查找數據幾乎總是比使用非聚簇索引快。每張表只能建一個(gè)聚簇索引,并且建聚簇索引需要至少相當該表120%的附加空間,以存放該表的副本和索引中間頁(yè)。建立聚簇索引的思想是:
1、大多數表都應該有聚簇索引或使用分區來(lái)降低對表尾頁(yè)的競爭,在一個(gè)高事務(wù)的環(huán)境中,對最后一頁(yè)的封鎖嚴重影響系統的吞吐量。
2、在聚簇索引下,數據在物理上按順序排在數據頁(yè)上,重復值也排在一起,因而在那些包含范圍檢查(between、、>=)或使用group by或order by的查詢(xún)時(shí),一旦找到具有范圍中第一個(gè)鍵值的行,具有后續索引值的行保證物理上毗連在一起而不必進(jìn)一步搜索,避免了大范圍掃描,可以大大提高查詢(xún)速度。
3、在一個(gè)頻繁發(fā)生插入操作的表上建立聚簇索引時(shí),不要建在具有單調上升值的列(如IDENTITY)上,否則會(huì )經(jīng)常引起封鎖沖突。
4、在聚簇索引中不要包含經(jīng)常修改的列,因為碼值修改后,數據行必須移動(dòng)到新的位置。
5、選擇聚簇索引應基于where子句和連接操作的類(lèi)型。
聚簇索引的侯選列是:
1、主鍵列,該列在where子句中使用并且插入是隨機的。
2、按范圍存取的列,如pri_order > 100 and pri_order ??
5、在連接操作中使用的列。
二、非聚簇索引(nonclustered indexes)的使用
SQL Server缺省情況下建立的索引是非聚簇索引,由于非聚簇索引不重新組織表中的數據,而是對每一行存儲索引列值并用一個(gè)指針指向數據所在的頁(yè)面。
??換句話(huà)說(shuō)非聚簇索引具有在索引結構和數據本身之間的一個(gè)額外級。一個(gè)表如果沒(méi)有聚簇索引時(shí),可有250個(gè)非聚簇索引。每個(gè)非聚簇索引提供訪(fǎng)問(wèn)數據的不同排序順序。在建立非聚簇索引時(shí),要權衡索引對查詢(xún)速度的加快與降低修改速度之間的利弊。另外,還要考慮這些問(wèn)題:
1、索引需要使用多少空間。
2、合適的列是否穩定。
3、索引鍵是如何選擇的,掃描效果是否更佳。
4、是否有許多重復值。
對更新頻繁的表來(lái)說(shuō),表上的非聚簇索引比聚簇索引和根本沒(méi)有索引需要更多的額外開(kāi)銷(xiāo)。對移到新頁(yè)的每一行而言,指向該數據的每個(gè)非聚簇索引的頁(yè)級行也必須更新,有時(shí)可能還需要索引頁(yè)的分理。
??從一個(gè)頁(yè)面刪除數據的進(jìn)程也會(huì )有類(lèi)似的開(kāi)銷(xiāo),另外,刪除進(jìn)程還必須把數據移到頁(yè)面上部,以保證數據的連續性。所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情況:
1、某列常用于集合函數(如Sum,。。。。)。
2、某列常用于join,order by,group by。
3、查尋出的數據不超過(guò)表中數據量的20%。