name tel age 大宝 13612345678 22 小明 13988776655 010-1234567 21 Ps:这个表中,属性值“分”了。
name tel age 手机 座机 大宝 13612345678 021-9876543 22 小明 13988776655 010-1234567 21 Ps:这个表中,属性 “分”了。 这两种情况都不满足第一范式。不满足第一范式的数据库,不是关系数据库!所以,我们在任何关系数据库管理系统中,做不出这样的“表”来。 第二范式(2NF) :符合1NF,并且,非主属性完全依赖于码。 听起来好像很神秘,其实真的没什么。 一个候选码中的主属性也可能是好几个。如果一个主属性,它不能单独作为一个候选码,那么它也不能确定任何一个非主属性。给一个反例:我们考虑一个小学的教务管理系统,学生上课指定一个老师,一本教材,一个教室,一个时间,大家都上课去吧,没有问题。那么数据库怎么设计?(学生上课表)
学生 课程 老师 老师职称 教材 教室 上课时间 小明 一年级语文(上) 大宝 副教授 《小学语文1》 101 14:30 一个学生上一门课,一定在特定某个教室。所以有(学生,课程)->教室 一个学生上一门课,一定是特定某个老师教。所以有(学生,课程)->老师 一个学生上一门课,他老师的职称可以确定。所以有(学生,课程)->老师职称 一个学生上一门课,一定是特定某个教材。所以有(学生,课程)->教材 一个学生上一门课,一定在特定时间。所以有(学生,课程)->上课时间 因此(学生,课程)是一个码。 然而,一个课程,一定指定了某个教材,一年级语文肯定用的是《小学语文1》,那么就有课程->教材。(学生,课程)是个码,课程却决定了教材,这就叫做不完全依赖,或者说部分依赖。出现这样的情况,就不满足第二范式! 有什么不好吗?你可以想想: 1、校长要新增加一门课程叫“微积分”,教材是《大学数学》,怎么办?学生还没选课,而学生又是主属性,主属性不能空,课程怎么记录呢,教材记到哪呢? ……郁闷了吧?( 插入异常) 2、下学期没学生学一年级语文(上)了,学一年级语文(下)去了,那么表中将不存在一年级语文(上),也就没了《小学语文1》。这时候,校长问:一年级语文(上)用的什么教材啊?……郁闷了吧?( 删除异常) 3、校长说:一年级语文(上)换教材,换成《大学语文》。有10000个学生选了这么课,改动好大啊!改累死了……郁闷了吧?(修改异常) 那应该怎么解决呢?投影分解,将一个表分解成两个或若干个表
学生 课程 老师 老师职称 教室 上课时间 小明 一年级语文(上) 大宝 副教授 101 14:30 学生上课表新
课程 教材 一年级语文(上) 《小学语文1》 课程的表 第三范式(3NF): 符合2NF,并且,消除传递依赖 上面的“学生上课表新”符合2NF,可以这样验证:两个主属性单独使用,不用确定其它四个非主属性的任何一个。 但是它有传递依赖! 在哪呢?问题就出在“老师”和“老师职称”这里。一个老师一定能确定一个老师职称。 有什么问题吗?想想: 1、老师升级了,变教授了,要改数据库,表中有N条,改了N次……(修改异常) 2、没人选这个老师的课了,老师的职称也没了记录……(删除异常) 3、新来一个老师,还没分配教什么课,他的职称记到哪?……(插入异常) 那应该怎么解决呢?和上面一样,投影分解:
学生 课程 老师 教室 上课时间 小明 一年级语文(上) 大宝 101 14:30
老师 老师职称 大宝 副教授 BC 范式(BCNF): 符合3NF,并且,主属性不依赖于主属性 若关系模式R属于第一范式,且每个属性都不传递依赖于候选码,则R属于BC范式。 通常 BC范式的条件有多种等价的表述:每个非平凡依赖的左边必须包含键码;每个决定因素必须包含候选码。 BC范式既检查非主属性,又检查主属性。当只检查非主属性时,就成了第三范式。满足BC范式的关系都必然满足第三范式。 还可以这么说:若一个关系达到了第三范式,并且它只有一个候选码,或者它的每个候选码都是单属性,则该关系自然达到BC范式。 一般,一个数据库设计符合3NF或BCNF就可以了。在BC范式以上还有第四范式、第五范式。 第四范式: 要求把同一表内的多对多关系删除。 第五范式: 从最终结构重新建立原始结构。 结语: 1、 在绝大多数应用中不需要设计到这种程度。并且,某些情况下,过于范式化甚至会对数据库的逻辑可读性和使用效率起到阻碍。数据库中一定程度的冗余并不一定是坏事情。如果你对第四范式、第五范式感兴趣可以看一看专业教材,从头学起,并且忘记我说的一切,以免对你产生误导。 2、 数据库设计是一门艺术,正确地应用规范化总是非常重要的。另一方面,规范化会增加表的数量,因此检索数据时需要进行的连接次数也会增加。由于数据存在于多张表中,因此,包含复杂连接的查询会降低速度。这主要体现在CPU的使用率上:查询越复杂,需要的CPU时间越多。 3、 通过故意提供冗余数据,可以降低连接的复杂性,获得更快的查询响应时间。因此,对一个表或多个表取消规范化也可能是必须的。 4、 无论规范化或者取消规范化,都要以实际应用和客户需求为准~~~~~~