亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

走向DBA[MSSQL篇] 針對大表 設(shè)計高效的存儲過程

系統(tǒng) 1829 0
原文: 走向DBA[MSSQL篇] 針對大表 設(shè)計高效的存儲過程【原理篇】 附最差性能sql語句進(jìn)化過程客串

測試的結(jié)果在 此處 ?本篇詳解一下原理


設(shè)計背景

由于歷史原因,線上庫環(huán)境數(shù)據(jù)量及其龐大,很多千萬級以上甚至過億的表。目標(biāo)是讓N張互相關(guān)聯(lián)的表 按照一張源表為基表,數(shù)據(jù)搬移歸檔 這里我們舉例N為50 每張表數(shù)據(jù)5000W


最差性能sql進(jìn)化客串

2表KeyName 字段意義 名稱等相同 從bug01 表中取出前500條不在bug02 表中的數(shù)據(jù)

最差性能:

      SELECT TOP 500 a.KeyName FROM bug01 a LEFT JOIN bug02 b on a.KeyName = b.KeyName 

WHERE (a.KeyName not in (select distinct b.KeyName From bug02)) 

ORDER BY a.KeyName asc


    

?進(jìn)化體在篇尾揭曉


詳細(xì)設(shè)計

問題點(diǎn):性能 安全 容錯

流程篇 為何如此設(shè)計 在下文中會解釋

step.1 源表數(shù)據(jù)過濾

這部分沒什么好說的 根據(jù)大家自己的業(yè)務(wù)場景設(shè)定不同的過濾規(guī)則

step.2 源表數(shù)據(jù)副本

程序的入口點(diǎn)肯定是源表了,擴(kuò)展表中的內(nèi)容都是以源表為Key來展開。那么這個展開的過程如何來做。

首先確定一些概念,這50表中的層級關(guān)系如何。可能直接和源表key鍵關(guān)聯(lián)的表只有10張。

例如我統(tǒng)計市內(nèi)所有圖書館詳細(xì)信息,那么我們以圖書館為源表。圖書館關(guān)聯(lián)書架、地址、會員信息。那么這3中信息我們分為一級別表。

書架關(guān)聯(lián)圖書類別,地址關(guān)聯(lián)街道信息,會員關(guān)聯(lián)用戶借閱信息,那么后面3者我們繼續(xù)分為二級表,......按照場景繼續(xù)擴(kuò)展。

方案1:使用游標(biāo) 循環(huán)源表 根據(jù)源表key值 處理和key相關(guān)的數(shù)據(jù)? 假設(shè)我們沒批次處理500跳源表數(shù)據(jù)

    也就是根據(jù)圖書館ID,遍歷所有節(jié)點(diǎn)。假設(shè)我們不分二級三級表,都是一級表 我們的insert操作次數(shù)是500*50。select操作同數(shù)據(jù)量

    這個給誰肯定都不大樂意,而且如果再遍歷2級表3級更難想象。

方案2:對源表key數(shù)據(jù)進(jìn)行集合,存進(jìn)變量,然后用in表達(dá)式。貌似可行。直接減少到1/500的操作次數(shù)。但是這里有個最恐怖的問題。

    變量都有長度,例如varchar 最大長度不能超過65535。

方案3:將源表Key做成一個查詢過濾池(相對于一級表 底層的sql where條件語句 下面會詳細(xì)介紹一下) 相對于第二種方案,我們這種似乎又將操作數(shù)提高了。

    不考慮層級的情況下,insert操作50。select操作50*2可以接受.

方案3擴(kuò)展: 對于一張大表來說 操作50次也不是什么可以樂觀的數(shù)字,并且這個50還有可能變成500,5000,50000。

      更有一個問題就是,當(dāng)你操作這500條的時候,可能會有數(shù)據(jù)干擾,你1秒前取得的這500條可不一定是1秒后的內(nèi)容。

      所以采取臨時表策略。

             CREATE TABLE #p

	(      

		OrderID varchar(50), 

		primary key (OrderID)      

	);

	SET @temp_text = 'INSERT INTO #p '+@KeyText

	--PRINT @temp_text

	EXEC (@temp_text)	

	

	SET @KeyText = 'SELECT OrderID FROM #p'

	--如果一級表關(guān)聯(lián)的操作次數(shù)比較多那么可以訪源表操作 以臨時表取代物理表

	SET @SubKeyText = 'select 一級表_A_被關(guān)聯(lián)鍵 From 一級表_A with(nolock) where 一級表_A_關(guān)聯(lián)源表鍵 in (' + @KeyText+')'

	

	CREATE TABLE #q

	(      

		OrderID varchar(50), 

		primary key (OrderID)      

	);

	SET @temp_text = 'INSERT INTO #q '+@SubKeyText

	EXEC (@temp_text)	

	SET @SubKeyText ='SELECT OrderID FROM #q'

	

	--如果一級表關(guān)聯(lián)的操作次數(shù)不多可以直接生成數(shù)據(jù)過濾池

	SET @SubKeyTextforA ='select 一級表_B_被二級關(guān)聯(lián)鍵 From 一級表_B with(nolock) where 一級表_B_關(guān)聯(lián)源表鍵 in (' + @KeyText+')'

	SET @SubKeyTextforB ='select 一級表_C_被二級關(guān)聯(lián)鍵 From 一級表_C with(nolock) where 一級表_C_關(guān)聯(lián)源表鍵 in (' + @KeyText+')'

	

	--如果存在更多層操作在此處可以繼續(xù)關(guān)聯(lián)資源過濾池 Demo只做到三層

SET @THKeyTextforA ='select 二級表_A_被三級關(guān)聯(lián)鍵 From 二級表_A with(nolock) where 二級表_A_關(guān)聯(lián)一級表鍵 in (' + @SubKeyTextforA+')'
    

?--step.3 分表歸檔操作

這個環(huán)節(jié)的問題是安全 事務(wù)如何控制 事務(wù)的大小如何衡量 如何容錯 以及如何將程序做得可擴(kuò)展 可維護(hù)

大家根據(jù)業(yè)務(wù)場景 區(qū)分自己的批次范圍 拿蟲子這篇demo來說?50張千萬級大表?如果是批次5000條以上 事務(wù)要放在內(nèi)層處理 如果是5000條以下 可以放在最外層

事務(wù)的大小直接影響性能的波動

容錯的方案大家也可以自己設(shè)計 蟲子的程序員采用第三類表 異常表來重置 失敗了就插入 下一個批次直接就過濾

      --將錯誤的批次訂單號入異常表

	Insert into 異常表(@ExTable) SELECT OrderID FROM #p

--@ExTable用來存放異常數(shù)據(jù) 如果當(dāng)期批次出錯 則將本次批次訂單信息入庫@ExTable下一批次則過濾這些數(shù)據(jù)再執(zhí)行

	SET @KeyText = 'SELECT TOP '+CAST(@SynSize AS VARCHAR(10))+' '+@Base_Key+' FROM +
    
      '+@BaseTable+'+ WHERE '+@Base_Key+' not in (select '+@Base_Key+' From '+@ExTable+') ' 


    

?如何讓程序變的漂亮 可維護(hù)

我們在存儲過程中同樣可以使用面試對象的思想 只不過存儲過程沒有類這樣的概念給我們 那么我們不妨自己設(shè)計

用什么 還是臨時表

      --一級 直接關(guān)聯(lián)源表主鍵 或?yàn)槎壉魂P(guān)聯(lián)的主表

	INSERT INTO #k VALUES ('一級表_A',@Base_Key,@KeyText,'')					--一級表_A

	INSERT INTO #k VALUES ('一級表_B',@Base_Key,@KeyText,'')					--一級表_B

	INSERT INTO #k VALUES ('一級表_C',@Base_Key,@KeyText,'')					--一級表_C

--二級 規(guī)則間接關(guān)聯(lián)

	--@SubKeyText相關(guān)

	INSERT INTO #k VALUES ('二級表_A','二級表_A_關(guān)聯(lián)一級鍵',@SubKeyText,'')				--二級表_A

	INSERT INTO #k VALUES ('二級表_B','二級表_B_關(guān)聯(lián)一級鍵',@SubKeyText,'')				--二級表_B	

	INSERT INTO #k VALUES ('二級表_C','二級表_C_關(guān)聯(lián)一級鍵',@SubKeyText,'')				--二級表_C

--特殊處理 

	--自定義操作

	INSERT INTO #k VALUES ('特殊表','特殊表關(guān)聯(lián)鍵','自定義數(shù)據(jù)過濾方式','')			

	

	--其他 自增列處理

	--修改訂單,及其取消修改訂單狀態(tài)歷史表

	INSERT INTO #k VALUES ('自增表',@Base_Key,@KeyText,'自定義字段')


    

?--step.4 處理細(xì)節(jié)?

?游標(biāo)循環(huán)臨時表 針對每一張表操作一次

      DECLARE CUR_ORDERHEDER INSENSITIVE CURSOR FOR SELECT TableName,KeyName,temptext,colname FROM #k 

	OPEN CUR_ORDERHEDER

	FETCH CUR_ORDERHEDER INTO @Cur_Table,@Cur_Key,@Cur_W,@Cur_K

		WHILE @@FETCH_STATUS = 0

			BEGIN				

				 EXECUTE P_Task_Sub_Synchronization

				 @OutParam  = @OutParam OUT, @OutMessage = @OutMessage OUT,

			@KeyText =  @Cur_W,@Table= @Cur_Table,@Extension=@Extension,@IsDelSource=@IsDelSource,@KeyName=@Cur_Key,@ColName=@Cur_K

				 --SET @OutMessage = @OutMessage+@OutMessage

				 --PRINT @OutMessage

				 IF @OutParam <> 0  

					 BEGIN

						SET @OutMessage = @OutMessage + @Cur_Table +'操作失敗'						

						ROLLBACK TRAN

						--將錯誤的批次訂單號入異常表

						Insert into 異常表(@ExTable) SELECT OrderID FROM #p

						DROP TABLE #k 

						DROP TABLE #p 

						DROP TABLE #q

						RETURN

					 END	

				 FETCH CUR_ORDERHEDER INTO @Cur_Table,@Cur_Key,@Cur_W,@Cur_K

			END

	ClOSE CUR_ORDERHEDER

	DEALLOCATE CUR_ORDERHEDER		


    

? --step.5 資源釋放

?--step.6 流程處理

?

這2個部分就不詳細(xì)說了 ?


最差性能sql進(jìn)化過程

step.1 not in了 就別再distinc了 distinc和not in都是臭名昭著的角色 not in后+dinstinc畫蛇添足而已

改后sql:

SELECT TOP 500 a.KeyName FROM bug01 a LEFT JOIN bug02 b on a.KeyName = b.KeyName
WHERE (a.KeyName not in (select? b.KeyName From bug02))
ORDER BY a.KeyName asc

step.2 別名 別小看別名 用圖來說話 原sql計劃

走向DBA[MSSQL篇] 針對大表 設(shè)計高效的存儲過程【原理篇】 附最差性能sql語句進(jìn)化過程客串

改后sql:

?SELECT TOP 500 a.KeyName FROM bug01 a LEFT JOIN bug02 b on a.KeyName = b.KeyName
WHERE (a.KeyName not in (select? c.KeyName From bug02 c ))
ORDER BY a.KeyName asc

走向DBA[MSSQL篇] 針對大表 設(shè)計高效的存儲過程【原理篇】 附最差性能sql語句進(jìn)化過程客串

step.3 何必要用外聯(lián)?直接過濾不就得了 嘿嘿

改后sql:

SELECT TOP 500 a.KeyName FROM bug01 a
WHERE (a.KeyName not in (select? c.KeyName From bug02 c))
ORDER BY a.KeyName asc

step.4 根據(jù)luofer同學(xué)的建議 再進(jìn)化一次 直接EXCEPT

SELECT TOP 500 a.KeyName FROM bug01 a except
SELECT b.KeyName from bug02 b


本篇就講到此處 歡迎大家討論

走向DBA[MSSQL篇] 針對大表 設(shè)計高效的存儲過程【原理篇】 附最差性能sql語句進(jìn)化過程客串


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 久久精品国产99精品最新 | 欧美亚洲第一页 | 国产精品永久免费10000 | 九九99热| 涩涩视频免费看 | 97综合久久| 久久精品久噜噜噜久久 | 国产成人禁片在线观看 | 在线韩日 | 国产精品日韩欧美一区二区 | 国产精品久久国产精麻豆99网站 | 四虎影院免费视频 | 香蕉视频a| 国产91在线|亚洲 | 久久麻豆视频 | 狠狠躁日日躁人人爽 | 奇米在线观看 | a级毛片免费 | 伊人久久精品亚洲午夜 | 久久国产免费福利资源网站 | 国产69精品久久久久999三级 | 国产一区视频在线播放 | 97精品视频在线 | 亚洲一区二区欧美 | 欧美日韩免费看 | 国产未成女年一区二区 | 久久99久久99精品观看 | 日日爽夜夜操 | 中文字幕在线精品视频万部 | 久久这里只有精品1 | 欧美大片一区 | 亚洲国产中文字幕在线观看 | 国产一区二区三区影院 | www久久精品| 啪啪99久久综合精品色 | 99视频在线精品 | 亚洲成a人一区二区三区 | 简单视频在线播放jdav | 日韩欧美综合在线二区三区 | 波多野结衣视频一区二区 | 亚洲精品久久激情影院 |