一、概念的區(qū)分
有些人把面向?qū)ο蟮臄?shù)據(jù)庫設(shè)計(jì)(即數(shù)據(jù)庫模式)思想與面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng)(OODBMS) 理論混為一談。其實(shí)前者是數(shù)據(jù)庫用戶定義數(shù)據(jù)庫模式的思路,后者是數(shù)據(jù)庫管理程序的思路。用戶使用面向?qū)ο蠓椒▽W(xué)可以定義任何一種DBMS數(shù)據(jù)庫,即網(wǎng)絡(luò)型、層次型、關(guān)系型、面向?qū)ο笮途?甚至文件系統(tǒng)設(shè)計(jì)也照樣可以遵循面向?qū)ο蟮乃悸贰?
面向?qū)ο蟮乃悸坊蚍Q規(guī)范可以用于系統(tǒng)分析、系統(tǒng)設(shè)計(jì)、程序設(shè)計(jì),也可以用于數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)、數(shù)據(jù)庫設(shè)計(jì)。OOSE自上至下、自始至終地貫徹面向?qū)ο笏悸?是一個(gè)一氣呵成的統(tǒng)一體。面向?qū)ο蟮臄?shù)據(jù)庫設(shè)計(jì)只是 OOSE 的一個(gè)環(huán)節(jié)。
二、數(shù)據(jù)庫設(shè)計(jì)的重要性
一般數(shù)據(jù)庫設(shè)計(jì)方法有兩種,即屬性主導(dǎo)型和實(shí)體主導(dǎo)型。屬性主導(dǎo)型從歸納數(shù)據(jù)庫應(yīng)用的屬性出發(fā),在歸并屬性集合(實(shí)體)時(shí)維持屬性間的函數(shù)依賴關(guān)系。實(shí)體主導(dǎo)型則先從尋找對(duì)數(shù)據(jù)庫應(yīng)用有意義的實(shí)體入手,然后通過定義屬性來定義實(shí)體。一般現(xiàn)實(shí)世界的實(shí)體數(shù)在屬性數(shù) 1/10 以下時(shí),宜使用實(shí)體主導(dǎo)型設(shè)計(jì)方法。面向?qū)ο蟮臄?shù)據(jù)庫設(shè)計(jì)是從對(duì)象模型出發(fā)的,屬于實(shí)體主導(dǎo)型設(shè)計(jì)。
一般數(shù)據(jù)庫應(yīng)用系統(tǒng)都遵循以下相關(guān)開發(fā)步驟:
1設(shè)計(jì)應(yīng)用系統(tǒng)結(jié)構(gòu);
2 選擇便于將應(yīng)用程序與 DBMS 結(jié)合的DBMS體系結(jié)構(gòu),如RDBMS;
3 根據(jù)應(yīng)用程序使用的環(huán)境平臺(tái),選擇適宜的DBMS(如Oracle)和開發(fā)工具(如PB);
4 設(shè)計(jì)數(shù)據(jù)庫,編寫定義數(shù)據(jù)庫模式的SQL程序;
5 編寫確保數(shù)據(jù)正確錄入數(shù)據(jù)庫的用戶接口應(yīng)用程序;
6 錄入數(shù)據(jù)庫數(shù)據(jù);7 運(yùn)行各種與數(shù)據(jù)庫相關(guān)的應(yīng)用程序,以確認(rèn)和修正數(shù)據(jù)庫的內(nèi)容。
對(duì)以上各步驟,有幾點(diǎn)需要說明:
(1) 這不是瀑布模型,每一步都可以有反饋。以上各步不僅有反饋、有反復(fù),還有并行處理。比如一些庫表在數(shù)據(jù)錄入時(shí),另一些庫表設(shè)計(jì)還在修改。這與我們的遞增式開發(fā)方法有關(guān),也與面向?qū)ο蟮奶卣饔嘘P(guān)。
(2) 上述順序不是絕對(duì)的,大多數(shù)場(chǎng)合是從第三步開始的。
(3) 對(duì)大多數(shù)數(shù)據(jù)庫應(yīng)用系統(tǒng)來說,上述各步中最重要、最困難的不是應(yīng)用系統(tǒng)設(shè)計(jì)而是數(shù)據(jù)庫設(shè)計(jì)。
三、DBMS的支持和數(shù)據(jù)庫設(shè)計(jì)
很多數(shù)據(jù)庫應(yīng)用系統(tǒng)開發(fā)者不重視數(shù)據(jù)庫設(shè)計(jì)的原因是:他們太迷信DBMS,認(rèn)為購入一個(gè)功能強(qiáng)大的 DBMS后數(shù)據(jù)庫設(shè)計(jì)就不困難、不重要了。一些國內(nèi)外的數(shù)據(jù)庫教材常常是在為DBMS的開發(fā)廠商做宣傳,而很少站在數(shù)據(jù)庫用戶角度,從數(shù)據(jù)庫應(yīng)用系統(tǒng)出發(fā)介紹數(shù)據(jù)庫設(shè)計(jì)方法。結(jié)果往往使讀者搞不清書中介紹的是數(shù)據(jù)庫管理程序的設(shè)計(jì)思想,還是應(yīng)用這種 DBMS 進(jìn)行數(shù)據(jù)庫設(shè)計(jì)的思想。
其實(shí),DBMS只是給用戶為已采用的數(shù)據(jù)庫提供一個(gè)舞臺(tái),而是否使用這個(gè)舞臺(tái)上的道具以及唱什么戲,則完全取決于用戶的戲劇腳本和導(dǎo)演(開發(fā)者)的安排。例如,公路局系統(tǒng)所使用的數(shù)據(jù)庫管理系統(tǒng),是以二維表為基本管理單元、支持所有關(guān)系代數(shù)操作、支持實(shí)體完整性與實(shí)體間參照完整性的全關(guān)系型 RDBMS,而我們要在這個(gè)舞臺(tái)上利用上述"道具"設(shè)計(jì)一個(gè)面向?qū)ο蟮年P(guān)系數(shù)據(jù)庫。
四、應(yīng)用對(duì)象模型與RDBMS模型的映射
數(shù)據(jù)庫設(shè)計(jì)(模式)是否支持應(yīng)用系統(tǒng)的對(duì)象模型,這是判斷是否是面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的基本出發(fā)點(diǎn)。由于應(yīng)用系統(tǒng)設(shè)計(jì)在前,數(shù)據(jù)庫設(shè)計(jì)隨后,所以應(yīng)用系統(tǒng)對(duì)象模型向數(shù)據(jù)庫模式的映射是面向?qū)ο髷?shù)據(jù)庫設(shè)計(jì)的關(guān)鍵。
1. 3層數(shù)據(jù)庫模式面向?qū)ο竽P偷臄U(kuò)展
一般數(shù)據(jù)庫設(shè)計(jì)多參照ANSL/SPARC關(guān)于數(shù)據(jù)庫模式的3層標(biāo)準(zhǔn)結(jié)構(gòu)提案。最接近物理數(shù)據(jù)庫的內(nèi)部模式由 DBMS 提供的SQL來描述。概念模式可以由若干個(gè)內(nèi)部模式聚集而成,它是由數(shù)據(jù)庫用戶規(guī)范的一些表的集合。一般的概念模式是數(shù)據(jù)庫物理模式作用域的邊界,它能實(shí)現(xiàn)數(shù)據(jù)庫的物理意義、特定DBMS 的特殊操作對(duì)外部應(yīng)用程序的信息隱蔽。外部模式是從特定用戶應(yīng)用角度看待的數(shù)據(jù)庫模式,從不同的應(yīng)用出發(fā)對(duì)同一概念模式可以給出多種不同的外部模式。當(dāng)外部應(yīng)用系統(tǒng)以對(duì)象模型進(jìn)行抽象時(shí),從各個(gè)應(yīng)用出發(fā)抽象出的對(duì)象模型可以映射到外部模型上,對(duì)此我們不妨稱之為外部對(duì)象模型。但是,外部模型只是概念模型的子集,所以面向?qū)ο蟮臄?shù)據(jù)庫設(shè)計(jì)核心在于系統(tǒng)對(duì)象模型(不妨稱之為概念對(duì)象模型) 向數(shù)據(jù)庫概念模型的映射 。
2. 對(duì)象模型向數(shù)據(jù)庫表的映射規(guī)則
由于 RDBMS 是以二維表為基本管理單元的,所以對(duì)象模型最終是由二維表及表間關(guān)系來描述的。換言之,對(duì)象模型向數(shù)據(jù)庫概念模型的映射就是向數(shù)據(jù)庫表的變換過程。有關(guān)的變換規(guī)則簡(jiǎn)單歸納如下:
(1) 一個(gè)對(duì)象類可以映射為一個(gè)以上的庫表,當(dāng)類間有一對(duì)多的關(guān)系時(shí),一個(gè)表也可以對(duì)應(yīng)多個(gè)類。
(2) 關(guān)系(一對(duì)一、一對(duì)多、多對(duì)多以及三項(xiàng)關(guān)系)的映射可能有多種情況,但一般映射為一個(gè)表,也可以在對(duì)象類表間定義相應(yīng)的外鍵。對(duì)于條件關(guān)系的映射,一個(gè)表至少應(yīng)有3個(gè)屬性。
(3) 單一繼承的泛化關(guān)系可以對(duì)超類、子類分別映射表,也可以不定義父類表而讓子類表擁有父類屬性;反之,也可以不定義子類表而讓父類表擁有全部子類屬性。
(4) 對(duì)多重繼承的超類和子類分別映射表,對(duì)多次多重繼承的泛化關(guān)系也映射一個(gè)表。
(5) 對(duì)映射后的庫表進(jìn)行冗余控制調(diào)整,使其達(dá)到合理的關(guān)系范式。
3. 數(shù)據(jù)庫模式要面向應(yīng)用系統(tǒng)
我們選擇面向?qū)ο蟮南到y(tǒng)設(shè)計(jì)也好,面向?qū)ο蟮臄?shù)據(jù)庫設(shè)計(jì)也好,根本目的是服務(wù)于應(yīng)用系統(tǒng)的需要。
五、面向?qū)ο箨P(guān)系數(shù)據(jù)庫設(shè)計(jì)效果
從某種意義上講,是數(shù)據(jù)庫設(shè)計(jì)的面向?qū)ο筇卣髯罱K奠定了整個(gè)系統(tǒng)的面向?qū)ο笮?才使面向?qū)ο蠓椒ㄔ诔绦蜷_發(fā)階段全面開花。其效果歸納如下:
1. 數(shù)據(jù)庫結(jié)構(gòu)清晰,便于實(shí)現(xiàn) OOP
由于實(shí)現(xiàn)了應(yīng)用模塊對(duì)象對(duì)數(shù)據(jù)庫對(duì)象的完全映射,數(shù)據(jù)庫邏輯模型可以自然且直接地模擬現(xiàn)實(shí)世界的實(shí)體關(guān)系。用戶所處的當(dāng)前物理世界、系統(tǒng)開發(fā)者所抽象的系統(tǒng)外部功能,與支持系統(tǒng)功能的內(nèi)部數(shù)據(jù)庫 (數(shù)據(jù)結(jié)構(gòu))一一對(duì)應(yīng),所以用戶、開發(fā)者和數(shù)據(jù)庫維護(hù)人員可以用一致的語言進(jìn)行溝通。特別是對(duì)多數(shù)不了解業(yè)務(wù)的程序開發(fā)人員來說,這種將應(yīng)用對(duì)象與相應(yīng)的數(shù)據(jù)對(duì)象封裝在對(duì)象統(tǒng)一體中的設(shè)計(jì)方法,大大減輕了程序?qū)崿F(xiàn)的難度,使他們只要知道加工的數(shù)據(jù)及所需的操作即可,而且應(yīng)用程序大多雷同,可以多處繼承由設(shè)計(jì)人員抽象出來的、預(yù)先開發(fā)好的各種物理級(jí)超類。
2. 數(shù)據(jù)庫對(duì)象具有獨(dú)立性,便于維護(hù)
除了數(shù)據(jù)庫表對(duì)象與應(yīng)用模塊對(duì)象一一對(duì)應(yīng)外,在邏輯對(duì)象模型中我們沒有設(shè)計(jì)多重繼承的泛化關(guān)系,所以這樣得到的數(shù)據(jù)庫結(jié)構(gòu)基本上是由父表類和子表類構(gòu)成的樹型層次結(jié)構(gòu),表類間很少有繼承以外的復(fù)雜關(guān)系,是一個(gè)符合局部化原則的結(jié)構(gòu),從而使數(shù)據(jù)庫表數(shù)據(jù)破壞的影響控制在局部范圍且便于修復(fù),給系統(tǒng)開通后的數(shù)據(jù)庫日常維護(hù)工作帶來便利。
3. 需求變更時(shí)程序與數(shù)據(jù)庫重用率高,修改少
在映射應(yīng)用對(duì)象時(shí),除關(guān)系映射規(guī)范化后可能出現(xiàn)一對(duì)多的表映射外,大多數(shù)應(yīng)用對(duì)象與表對(duì)象是一一對(duì)應(yīng)的。我們可以把規(guī)范化處理后的、由一個(gè)應(yīng)用對(duì)象映射出來的多個(gè)表看成一個(gè)數(shù)據(jù)庫對(duì)象。因此當(dāng)部分應(yīng)用需求變更時(shí),首先,系統(tǒng)修改可以不涉及需求不變更的部分。其次,變更部分的修改可以基本上只限于追加或刪除程序模塊或追加新庫表,而基本上不必修改原有程序代碼或原有庫表定義,從而大大減少了工作量,降低了工作難度。
六、最簡(jiǎn)單的就是最好的
客觀世界是錯(cuò)綜復(fù)雜的,計(jì)算機(jī)科學(xué)理論的發(fā)展也越來越高深、復(fù)雜。然而,人類探索理論和技術(shù)的最終目的是:讓客觀世界的復(fù)雜變簡(jiǎn)單,最簡(jiǎn)單的就是最好的。為此給出以下幾點(diǎn)忠告:
1. 慎用外鍵
RDBMS 支持復(fù)雜關(guān)系的能力很強(qiáng),無論用戶怎么在邏輯上設(shè)定外鍵,它基本上都能從物理上幫用戶實(shí)現(xiàn)。但是外鍵把許多獨(dú)立的實(shí)體牽連在一起,不僅使 RDBMS 維持?jǐn)?shù)據(jù)一致性負(fù)擔(dān)沉重,也使數(shù)據(jù)庫應(yīng)用復(fù)雜化,加重了程序開發(fā)負(fù)擔(dān)。這樣的數(shù)據(jù)庫很難理解,很難實(shí)現(xiàn)信息隱蔽性設(shè)計(jì),往往把簡(jiǎn)單問題復(fù)雜化。
2. 適當(dāng)冗余
減少數(shù)據(jù)庫冗余的設(shè)計(jì)思路產(chǎn)生于70年代,它是促使 DBMS 進(jìn)步的重要?jiǎng)恿χ弧H欢?猶如為了節(jié)省2個(gè)字節(jié)的存儲(chǔ)空間而釀成了如今全球?yàn)橹^痛的2000年問題一樣,它是計(jì)算機(jī)硬件主導(dǎo)時(shí)代的產(chǎn)物。以今天國內(nèi)計(jì)算機(jī)市場(chǎng)價(jià)格為例,6G服務(wù)器硬盤的價(jià)格不過2000元,而上海物價(jià)局 1996 年頒發(fā)的一個(gè)人月軟件開發(fā)的指導(dǎo)價(jià)約8000元,即一個(gè)人月的軟件價(jià)格就可以購買20G左右的硬盤。即使有5萬行數(shù)據(jù)的庫表,每個(gè)記錄壓縮40字符的冗余,單純計(jì)算合計(jì)也不足2M,即節(jié)省0.6元錢的磁盤空間。
今天的世界已進(jìn)入軟件主導(dǎo)的計(jì)算機(jī)時(shí)代。因此,最容易理解、應(yīng)用開發(fā)工作量最少、維護(hù)最簡(jiǎn)單的數(shù)據(jù)庫結(jié)構(gòu)才是最好的。只要數(shù)據(jù)完整性、一致性不受威脅,有些冗余,不足為慮。換言之,最節(jié)省軟件成本 (而不是硬件成本) 的是最好的。
3. 信息隱蔽
這是軟件工程最重要的基本原則之一。簡(jiǎn)言之即信息的作用域越小越好,數(shù)據(jù)庫的透明度越大越好,因?yàn)閼?yīng)用程序需要知道得越多就越復(fù)雜。使數(shù)據(jù)庫黑盒化 (透明度高) 的方法很多,除了設(shè)計(jì)上的局部化處理外,還可以利用 DBMS 的觸發(fā)器、存儲(chǔ)過程、函數(shù)等,把數(shù)據(jù)庫中無法簡(jiǎn)化的復(fù)雜表關(guān)系封裝到黑盒子里,隱藏起來,特別是放到服務(wù)器端,其優(yōu)越性更是多方面的。
|