一、關(guān)系數(shù)據(jù)庫設(shè)計(jì)范式介紹
1. 第一范式(1NF)無重復(fù)的列
所謂第一范式(1NF)是指數(shù)據(jù)庫表的每一列都是不可分割的基本數(shù)據(jù)項(xiàng),同一列中不能有多個(gè)值,即實(shí)體中的某個(gè)屬性不能有多個(gè)值或者不能有重復(fù)的屬性。如果出現(xiàn)重復(fù)的屬性,就可能需要定義一個(gè)新的實(shí)體,新的實(shí)體由重復(fù)的屬性構(gòu)成,新實(shí)體與原實(shí)體之間為一對(duì)多關(guān)系。在第一范式(1NF)中表的每一行只包含一個(gè)實(shí)例的信息。簡(jiǎn)而言之,第一范式就是無重復(fù)的列。
說明:在任何一個(gè)關(guān)系數(shù)據(jù)庫中,第一范式(1NF)是對(duì)關(guān)系模式的基本要求,不滿足第一范式(1NF)的數(shù)據(jù)庫就不是關(guān)系數(shù)據(jù)庫。
那么符合第一范式的特點(diǎn)就有: 1)有主關(guān)鍵字 2)主鍵不能為空 3)主鍵不能重復(fù) 4)字段不可以再分
2. 第二范式(2NF)屬性完全依賴于主鍵[消除非主屬性對(duì)主碼的部分函數(shù)依賴 ]
第二范式(2NF)是在第一范式(1NF)的基礎(chǔ)上建立起來的,即滿足第二范式(2NF)必須先滿足第一范式(1NF)。第二范式(2NF)要求數(shù)據(jù)庫表中的每個(gè)實(shí)例或行必須可以被唯一地區(qū)分。為實(shí)現(xiàn)區(qū)分通常需要為表加上一個(gè)列,以存儲(chǔ)各個(gè)實(shí)例的唯一標(biāo)識(shí)。例如員工信息表中加上了員工編號(hào)(emp_id)列,因?yàn)槊總€(gè)員工的員工編號(hào)是唯一的,因此每個(gè)員工可以被唯一區(qū)分。這個(gè)唯一屬性列被稱為主關(guān)鍵字或主鍵、主碼。
第二范式(2NF)要求實(shí)體的屬性完全依賴于主關(guān)鍵字。所謂完全依賴是指不能存在僅依賴主關(guān)鍵字一部分的屬性,如果存在,那么這個(gè)屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系。為實(shí)現(xiàn)區(qū)分通常需要為表加上一個(gè)列,以存儲(chǔ)各個(gè)實(shí)例的唯一標(biāo)識(shí)。簡(jiǎn)而言之,第二范式就是屬性完全依賴于主鍵。
3. 第三范式(3NF)屬性不依賴于其它非主屬性[消除傳遞依賴]
滿足第三范式(3NF)必須先滿足第二范式(2NF)。簡(jiǎn)而言之,第三范式(3NF)要求一個(gè)數(shù)據(jù)庫表中不包含已在其它表中已包含的非主關(guān)鍵字信息。例如,存在一個(gè)部門信息表,其中每個(gè)部門有部門編號(hào)(dept_id)、部門名稱、部門簡(jiǎn)介等信息。那么在的員工信息表中列出部門編號(hào)后就不能再將部門名稱、部門簡(jiǎn)介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表,則根據(jù)第三范式(3NF)也應(yīng)該構(gòu)建它,否則就會(huì)有大量的數(shù)據(jù)冗余。簡(jiǎn)而言之,第三范式就是屬性不依賴于其它非主屬性。
4. 第四范式:
主要任務(wù):滿足第三范式的前提下,消除多值依賴
5. 第五范式:
定義: 如果關(guān)系模式R中的每一個(gè)連接依賴, 都是由R的候選鍵所蘊(yùn)含, 稱R是第五范式的
看到定義,就知道是要消除連接依賴,并且必須保證數(shù)據(jù)完整
(第四,第五范式應(yīng)用較少,主要是理解和應(yīng)用前三個(gè)范式就可以了。)
二、范式應(yīng)用實(shí)例剖析
下面以一個(gè)學(xué)校的學(xué)生系統(tǒng)為例分析說明,這幾個(gè)范式的應(yīng)用。首先第一范式(1NF):數(shù)據(jù)庫表中的字段都是單一屬性的,不可再分。這個(gè)單一屬性由基本類型構(gòu)成,包括整型、實(shí)數(shù)、字符型、邏輯型、日期型等。在當(dāng)前的任何關(guān)系數(shù)據(jù)庫管理系統(tǒng)(DBMS)中,傻瓜也不可能做出不符合第一范式的數(shù)據(jù)庫,因?yàn)檫@些DBMS不允許你把數(shù)據(jù)庫表的一列再分成二列或多列。因此,你想在現(xiàn)有的DBMS中設(shè)計(jì)出不符合第一范式的數(shù)據(jù)庫都是不可能的。
首先我們確定一下要設(shè)計(jì)的內(nèi)容包括那些。學(xué)號(hào)、學(xué)生姓名、年齡、性別、課程、課程學(xué)分、系別、學(xué)科成績(jī),系辦地址、系辦電話等信息。為了簡(jiǎn)單我們暫時(shí)只考慮這些字段信息。我們對(duì)于這些信息,說關(guān)心的問題有如下幾個(gè)方面。
學(xué)生有那些基本信息
學(xué)生選了那些課,成績(jī)是什么
每個(gè)課的學(xué)分是多少
學(xué)生屬于那個(gè)系,系的基本信息是什么。
1. 第二范式(2NF)實(shí)例分析
首先我們考慮,把所有這些信息放到一個(gè)表中(學(xué)號(hào),學(xué)生姓名、年齡、性別、課程、課程學(xué)分、系別、學(xué)科成績(jī),系辦地址、系辦電話)下面存在如下的依賴關(guān)系。
(學(xué)號(hào))→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
(課程名稱) → (學(xué)分)
(學(xué)號(hào),課程)→ (學(xué)科成績(jī))
問題分析
因此不滿足第二范式的要求,會(huì)產(chǎn)生如下問題
數(shù)據(jù)冗余: 同一門課程由n個(gè)學(xué)生選修,"學(xué)分"就重復(fù)n-1次;同一個(gè)學(xué)生選修了m門課程,姓名和年齡就重復(fù)了m-1次。
更新異常:
1)若調(diào)整了某門課程的學(xué)分,數(shù)據(jù)表中所有行的"學(xué)分"值都要更新,否則會(huì)出現(xiàn)同一門課程學(xué)分不同的情況。
2)假設(shè)要開設(shè)一門新的課程,暫時(shí)還沒有人選修。這樣,由于還沒有"學(xué)號(hào)"關(guān)鍵字,課程名稱和學(xué)分也無法記錄入數(shù)據(jù)庫。
刪除異常: 假設(shè)一批學(xué)生已經(jīng)完成課程的選修,這些選修記錄就應(yīng)該從數(shù)據(jù)庫表中刪除。但是,與此同時(shí),課程名稱和學(xué)分信息也被刪除了。很顯然,這也會(huì)導(dǎo)致插入異常。
解決方案
把選課關(guān)系表SelectCourse改為如下三個(gè)表:
學(xué)生:Student(學(xué)號(hào),姓名, 年齡,性別,系別,系辦地址、系辦電話);
課程:Course(課程名稱, 學(xué)分);
選課關(guān)系:SelectCourse(學(xué)號(hào), 課程名稱, 成績(jī))。
2. 第三范式(3NF)實(shí)例分析
接著看上面的學(xué)生表Student(學(xué)號(hào),姓名, 年齡,性別,系別,系辦地址、系辦電話),關(guān)鍵字為單一關(guān)鍵字"學(xué)號(hào)",因?yàn)榇嬖谌缦聸Q定關(guān)系:
(學(xué)號(hào))→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
但是還存在下面的決定關(guān)系
(學(xué)號(hào)) → (所在學(xué)院)→(學(xué)院地點(diǎn), 學(xué)院電話)
即存在非關(guān)鍵字段"學(xué)院地點(diǎn)"、"學(xué)院電話"對(duì)關(guān)鍵字段"學(xué)號(hào)"的傳遞函數(shù)依賴。
它也會(huì)存在數(shù)據(jù)冗余、更新異常、插入異常和刪除異常的情況。 (數(shù)據(jù)的更新,刪除異常這里就不分析了,可以參照2.1.1進(jìn)行分析)
根據(jù)第三范式把學(xué)生關(guān)系表分為如下兩個(gè)表就可以滿足第三范式了:
學(xué)生:(學(xué)號(hào), 姓名, 年齡, 性別,系別);
系別:(系別, 系辦地址、系辦電話)。
總結(jié):
上面的數(shù)據(jù)庫表就是符合I,II,III范式的,消除了數(shù)據(jù)冗余、更新異常、插入異常和刪除異常。
更多信息請(qǐng)查看IT技術(shù)專欄