在數(shù)據(jù)集市設(shè)計(jì)中可以使用3種基本的系統(tǒng)方法:數(shù)據(jù)驅(qū)動(dòng)的方法、需求驅(qū)動(dòng)的方法和混合方法。它們的區(qū)別在于源數(shù)據(jù)庫(kù)分析和終端用戶需求分析階段所占的比重。方法的選擇將極大地影響概念設(shè)計(jì)的方式。
數(shù)據(jù)驅(qū)動(dòng)方法包括:基于實(shí)體-關(guān)系模式的設(shè)計(jì)、基于關(guān)系模式的設(shè)計(jì)、基于XML模式的設(shè)計(jì)。概念型實(shí)體-關(guān)系模式比關(guān)系型邏輯模式更具表達(dá)力。因此通常認(rèn)為前者是更好的設(shè)計(jì)源。但實(shí)際情況是公司經(jīng)常無法提供精確完整的實(shí)體-關(guān)系模式(丟失、文檔不完整或者其他原因)。那么就只能根據(jù)數(shù)據(jù)庫(kù)的邏輯模式來做。另一方面,Web數(shù)據(jù)大部分是XML格式的,基于XML模式的設(shè)計(jì)可以從XML源的模式派生一個(gè)數(shù)據(jù)集市概念模式。
1 數(shù)據(jù)驅(qū)動(dòng)方法設(shè)計(jì)
1.1 基于實(shí)體-關(guān)系模式的設(shè)計(jì)
在數(shù)據(jù)集市的符合維度事實(shí)模型(DFM)的概念設(shè)計(jì)中使用的基于實(shí)體-關(guān)系模式的技術(shù)包含以下步驟:
(1)定義事實(shí)。
(2)對(duì)于每個(gè)事實(shí):
? ? ? ? ? a. 建立一個(gè)屬性樹。
? ? ? ? ? b. 修剪和移植屬性樹。
? ? ? ? ? c. 定義維度。
? ? ? ? ? d. 定義度量。
? ? ? ? ? e. 創(chuàng)建事實(shí)模式。
首先從數(shù)據(jù)源模式中選擇相關(guān)事實(shí)。然后以半自動(dòng)模式創(chuàng)建屬性樹。這是一個(gè)過渡結(jié)構(gòu),可用于確定事實(shí)模式的邊界以清除不相關(guān)屬性及修改鏈接到這些不相關(guān)屬性的依賴關(guān)系(對(duì)應(yīng)步驟(2).b)。 屬性樹 鏈接了數(shù)據(jù)集市和數(shù)據(jù)源模式。這個(gè)鏈接是 數(shù)據(jù)準(zhǔn)備過程的關(guān)鍵 。之后將屬性樹轉(zhuǎn)換為事實(shí)模式(步驟(2).e)就相對(duì)簡(jiǎn)單了。其中,步驟a基于一種算法;步驟cde基于屬性的目標(biāo)特性;步驟1和b需要深入理解公司的商業(yè)模型。
1.1.1 定義事實(shí)
事實(shí)通常對(duì)應(yīng)于公司中動(dòng)態(tài)發(fā)生的事件。在實(shí)體-關(guān)系模式中, 事實(shí) 可能對(duì)應(yīng)著一個(gè) 實(shí)體 或者E1,E2,...,En實(shí)體間的n元 關(guān)系 R。對(duì)于后者,為簡(jiǎn)便起見,可將R轉(zhuǎn)換為一個(gè)實(shí)體( 實(shí)體化過程 )。為此,添加一個(gè)新實(shí)體F,并使用F和Ei間的二元關(guān)系(Ri)替換R的每個(gè)分支。若使用min(E, A)和max(E, A)分別表示 最小基數(shù)等級(jí) 和 最大基數(shù)等級(jí) (基數(shù)等級(jí)是指實(shí)體E在相應(yīng)等級(jí)上參與關(guān)系A(chǔ),通常min(E, A)∈{0, 1},max(E, A)∈{1, n}),則:min(F, Ri) = max(F, Ri) = 1, min(Ei, Ri) = min(Ei, R), max(Ei, Ri) = max(Ei, R)。
注意:有時(shí)不同的實(shí)體可能是表達(dá)個(gè)體事實(shí)的候選。建議選作事實(shí)的實(shí)體應(yīng)該是構(gòu)建包含盡可能多的屬性的屬性樹的實(shí)體。
1.1.2 構(gòu)建屬性樹
屬性樹
給定實(shí)體-關(guān)系數(shù)據(jù)源模式的一個(gè)相關(guān)部分,以及它的一個(gè)被分類為事實(shí)的實(shí)體F,屬性樹是滿足以下要求的樹:
?
- 每個(gè)節(jié)點(diǎn)對(duì)應(yīng)于一個(gè)數(shù)據(jù)源模式屬性(簡(jiǎn)單或復(fù)合屬性)。
- 根對(duì)應(yīng)于F實(shí)體的標(biāo)識(shí)符。
- 對(duì)于每個(gè)節(jié)點(diǎn)v,對(duì)應(yīng)的屬性通過函數(shù)決定了對(duì)應(yīng)于v的后繼的所有屬性。
?
1.1.3 修剪和移植屬性樹
1.1.4 定義維度
1.1.5 定義度量
1.1.6 生成事實(shí)模式
1.2 基于關(guān)系模式的設(shè)計(jì)
1.3 基于XML模式的設(shè)計(jì)
2 混合方法設(shè)計(jì)
3 需求驅(qū)動(dòng)方法設(shè)計(jì)
參考資料:
《數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì):現(xiàn)代原理與方法》Matteo Golfarelli,Stefano Rizzi著
?
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
