MSE复试_数据库知识点整理

知识点提纲:

第二章:关系模型的基本概念与基本理论
2.1 数据库的基本概念
··数据库,数据库管理系统(DBMS - database management system),数据模型(data model)
2.2 关系模型的基本概念
··数据结构:二维表(table/relation),属性(column/attribute),元组(row/tuple),表头(table heading),域(domain)
··约束规则(relational rule)
··键(key)与超键(superkey)
··空值(null value)
2.3 关系模型的基本理论 — 关系代数(relational algebra)
··表/关系在关系代数中的表示
··关系代数中的运算符:
··传统的集合运算符(并、交、差) & 纯粹的关系运算符(投影,选择,笛卡儿乘积,自然联接,除法,θ-联接)
··基本运算(并,差,投影,选择,笛卡儿乘积) & 扩充运算(交,自然联接,除法,……)
··难点:减法、除法和表自身的连接运算
··关系代数的应用

Ch2 知识点详解
2.1 数据库的基本概念
数据库:为一个共同的目的而保存起来的所有数据的集合。
数据库管理系统:DBMS,是一套计算机程序,它把企业的数据以记录的形式保存在计算机中。
数据模型:data model,是一套描述如何将现实世界的数据在概念上用电子信息表示的定义,它还表示为用来操作这些数据的一类操作。
几种数据模型
Hierarchical Data Model/层次数据模型(树)
Network Data Model/网状数据模型(图)
Relational Model/关系模型(表)
Object-Relational Model/对象关系模型 (不受第一范式规则约束的关系模型、表中元素可以是集合)。
2.2 关系模型的基本概念
数据结构:
表/关系(table/relation):file of records。表是以行和列的形式组织起来的数据的集合(wiki)。
列/属性(column/attribute):field names of records。
行/元组(row/tuple):records of a file。
表头/模式(table heading/schema):列名的集合。
域(domain):可以被用作表的属性值的常数的集合。
约束规则(relationarule):
Rule 1. 第一范式规则:在定义的表中,关系模型坚持不允许含有多值属性和含有内部结构的列。
Rule 2. 只能基于内容取行规则:只可以通过行的内容,即每一行中所存在的属性值来检索列。
Rule 3. 行唯一性原则:关系中的任何两个元组的值在同一时刻不能是完全相同的。
Rule 4. 实体完整性规则:表T中的任意行在主键列的取值都不允许为空值。

超键(Superkey):表的任意两行数据在该列的集合上都有唯一的值,类似于线性代数中向量组的一个“代表”,且该向量组中的向量不需要是线性无关的。
键(Key):组成键的列集合中再也没有子集也是表的超键。亦即不含有多余属性的超键。类似于线代中向量组的一个极大无关组。
候选键(Candidate Key):关系的所有键。亦即不含有多余属性的超键的集合。类似于线代中向量组的全部极大无关组。
主键(Primary Key):被数据库设计者选择出来作为表中特定行的唯一性标识符的某一个候选键。
空值(null value):未知的或尚未定义的值。(计算平均值时被剔除)

2.3 关系模型的基本理论——关系代数(relational algebra)
表/关系在关系代数中的表示
关系代数中的运算符
1、集合运算:R ∪ S R ∩ S R – S R × S
兼容表:表头相同且属性的域相同。
并(∪)、交(∩)、差(-)是针对行的操作;
赋值(:=)是针对表的操作;
乘(×)即对两个表的所有做作笛卡尔乘积。
2、自然关系运算:投影、选择、连接、除
投影运算:R在Ai1, Ai2, … , Aik上的投影用R[Ai1, Ai2, … , Aik]表示,如CUSTOMER[name]。即把某几列从表中选出,重复的值会被合并。
选择运算:S where C,C也可以是C and C’,C or C’或者not C。
连接运算:R ∞ S,即选出属性重叠部分值相同的元组。没有共同属性时连接的结果与笛卡尔乘积相同。
除运算:乘积的逆运算(每行除后取交集),用于处理“所有”问题。
3、扩充运算:外连接、θ连接
外连接:R ∞0 S,即将两个表完全“并”起来,无对应值时补null。
左外链接:R ∞L0 S,即保留左边未匹配的行,右边补null。
右外链接:R ∞R0 S,即保留右边未匹配的行,左边补null。
θ连接:θ可以是{>, <, >=, <=, =, <>}中的一个。表示为R ∞Ai θ Bj S,即两个表满足θ条件的连接。若Ai和Bj同名,则表示为R ∞R.Ai θ S.Bj S。

难点:减法、除法和表自身的连接运算
关系代数的应用