朋友的一個checksum計算列建立的索引:
在數(shù)據(jù)庫設(shè)計中需要一列標(biāo)注網(wǎng)頁的URL地址,LINK NVARCHAR(1000)。在INSERT的時候需要判斷之前有無同樣的URL地址記錄被插入。
也就是用select top 1 @ID=ID from Table where Link=@Link,然后判斷@ID值是否大于0。
如果數(shù)據(jù)量過大,需要給LINK加為索引,但是這時會發(fā)現(xiàn)SQL SERVER的索引對那么大的NVARCHR是無法建立的,限制在200字符以內(nèi)。
我在最早的時候解決這個問題是采用了對LINK進(jìn)行MD5化,MD5的值只有幾十個字符長,然后對MD5結(jié)果進(jìn)行索引。但這樣做性能其實一般,而且大字段的數(shù)據(jù)庫索引同樣會占用不少存儲空間。
其實在SQL SERVER中可以設(shè)置計算字段,就是說該字段是可以是其他字段的計算結(jié)果。這樣的話就用CHECKSUM來優(yōu)化上述的索引問題。
做法范例:
alter table tablename add csLink as CHECKSUM(Link)。
?
這樣就建立一個csLink列,生成的CHECKSUM值是一個大的整數(shù)。對該列進(jìn)行索引,相當(dāng)于對BITINT型進(jìn)行索引,索引存儲空間也非常節(jié)約。這樣在判別有無重復(fù)LINK的時候就使用:
select top 1 @ID=ID from Table where csLink=CHECKSUM(@Link) And Link=@Link
?
數(shù)據(jù)庫會優(yōu)先判斷csLink索引字段,而實際測試100萬條記錄的CHECKSUM,無一重復(fù),所以第一次匹配的返回條數(shù)是極少的,基本可以做到一批匹配,而考慮肯能會有重復(fù)記錄,因此再加上And Link=@Link,這樣是在小的數(shù)據(jù)集中再次做無索引匹配,這樣性能損耗幾乎沒有感覺。
計算字段給我感覺就好像視圖,計算字段的靈活度除了簡化查找SELECT語句之外,對索引優(yōu)化的作用是非常大的。CHECKSUM的用法只是發(fā)現(xiàn)之一,在今后一定會發(fā)現(xiàn)更多的有用的TIPS
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
