数据库复习笔记

数据库从入门到精通

第一章:绪论

数据库的四个基本概念:

数据:数据是数据库中存储的基本对象

数据库:存放数据的仓库,是长期存储在计算机内,有组织的,可共享的大量数据的集合

数据库管理系统:是位于用户与操作系统之间的一层数据管理软件

包含:数据定义,/数据组织,存储和管理/数据操纵功能/数据库的事务管理和运行管理/数据库的建立和维护功能/其他功能

数据库系统:由数据库,数据库管理系统,应用程序和数据库管理员组成的存储管理处理和维护数据的系统

数据库管理系统的产生和发展:

人工管理阶段:程序小,用完就走,不进行保存,数据不共享,数据不具有独立性

文件管理阶段:数据可以长期保存,文件系统管理数据,数据共享性差,冗余大,数据独立性差

数据库管理阶段:是管理技术的飞跃,对于文件管理阶段的弊端做出了革命性的优化

数据库管理系统的特点:

数据结构化:数据库系统实现了整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别

数据的共享性高,冗余低且易扩展

数据独立性高

数据由数据库管理系统统一管理和控制:包含数据的安全性保护,数据的完整性检查,并发控制,数据库恢复

数据模型:对现实世界的抽象,分为概念模型和逻辑/物理模型

概念模型:

信息世界中的基本概念:
实体:客观存在可相互区别的事物
属性:尸体所具有的某一特性
码:唯一标识实体的属性集
实体型:用实体名及其属性名集合来抽象和刻画同类实体

概念模型的一种表示方法:实体-联系方法(ER图)

数据模型的组成要素:由数据结构,数据操作,和数据的完整性约束条件三部分组成

数据结构:描述数据库的组成对象以及对象之间的联系

数据操作:对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及相关的操作规则

完整性约束条件:是一组完整性规则

常用的数据模型:

层状模型:以树型结构来表示各类尸实体的联系,有且仅有一个结点,没有双亲结点,这个结点称为根结点,根以外的其他结点有且仅有一个双亲结点,缺点:现实中有很多不是层次的数据形式,就显得这类联系很笨拙

网状模型:在数据库中允许由一个以上的结点无双亲,一个结点可以有多于一个的双亲,缺点结构化比较复杂需要嵌入到程序语言中,用户不容易掌握,加重了编写程序的负担

关系模型:每个关系的数据结构都是一张二维的表,数据模型要求的关系必须是规范化的,关系中的每一个分量必须是一个不可分的数据项

关系:一个关系对应一张表
元组:表中的一行
属性:表中的一列
码:可以唯一确定一个元组
域:具有相同数据类型的值的集合
分量:元组中的一个属性值

面向对象数据模型

对象关系模型

半结构化数据模型

数据库系统的结构:

数据库系统模型的概念:数据库中有“型”和“值”的概念,模式是相对稳定的,而实例是相对变动的

数据库系统的三级模式结构:由外模式,内模式和模式三级构成

模式:逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据的视图
外模式:也叫子模式或者用户模式,他是数据库用户能看到和使用的局部数据的逻辑结构和特征的描述是数据库用户的数据视图,是与某一应用有关的数据的逻辑地表示
内模式:也称为存储模式,一个数据库只有一个内模式。

数据库的二级映像功能与数据独立性:

外模式/模式映射:对外模式的相应改变,可以使外模式保持不变

模式/内模式映射:当数据库的存储结构改变的时候,由数据库管理员对模式/内模式映像做相应改变,可以使模式不变,从而应用程序也不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性数据与程序独立减少了应用程序的维护和修改

数据库系统的组成:

硬件平台和数据库:,足够大的内存,足够大的硬盘,较高的通道能力

软件:数据库管理系统,支持管理系统的操作系统,具有与数据库操作的高级语言的开发环境,以数据库为核心的引用开发工具,为特定应用环境开发的数据库应用系统。

人员:数据库管理员,系统分析员和数据库设计人员,应用程序员,用户

第二章:关系数据库

关系:

域:一组具有相同数据类型的值的集合

笛卡尔积:域上的一种集合运算,一个域允许的不同取值个数称为这个域的基数

关系:某一属性组的值能唯一地标识一个元组,而其子集不能,则称该属性组为候选码

若一个关系有多个候选码,则选其中一个为主码。候选码的诸属性称为主属性,不包含在任何候选码中的属性称为非主属性或者非码属性全码:候选码只包含一个属性,极端情况下,关系模式的所有属性是这个关系模式的候选码。

关系有三种类型:基本关系(又称为基本表或者基表),查询表和视图表。

基本关系具有以下六条属性:

列是同质的,即每一列中的分量是同一类型的数据,来自同一个域
不同的列可出自同一个域,称其中的每一列为一个属性
列的顺序无所谓,即列的次序可以随意交换
行的顺序无所谓,即行的次序可以随意交换
分量必须取原子值
这些规范条件中最基本的一条是关系的每一个分量必须是一个不可分的数据项

关系模式:关系的描述称为关系模式 R(U,D,DOM,F)

关系数据库:关系数据库的型也称为关系数据库模式,是对关系数据库的描述,关系数据库的值是这些关系模式在某一时刻对应的关系的集合通常称为关系数据库

关系模型的存储结构:物理数据的组织交给操作系统完成

关系的操作:

基本关系操作:

常用的关系操作有:查询(query),插入(insert),删除(delete),修改(updata)查询操作分为:选择,投影,并,差,笛卡尔积,操作的特点是集合操作即操作的对象和结果都是集合

关系数据库语言的分类:早期的关系操作主要有关系代数和关系演算,关系演算分为元组关系演算和域关系演算。现代使用的是介于关系代数和关系演算之间的结构化查询语句(SQL)其不仅具有丰富的查询功能还有数据定义和数据控制功能。

关系的完整性:关系模式的三类完整性约束:实体完整性约束,参照完整性和用户定义的完整性

关系完整性:若属性A是属性关系R的主属性,则A不能取空值。所谓空值,指的是“不知道”,“不存在”,“无意义的值”

参照完整性:设F是基本关系R的一个或一组属性,但不是关系R的码,Ks是基本关系S的主码。如果F和Ks相对应,则称F是R的外码,并称基本关系R是参照关系,基本关系S为被参照关系或目标关系

用户定义的完整性

关系代数:是一种抽象的查询语句,它用对关系的运算来表达查询,关系的代数的运算按照运算符的不同可分为传统集合运算(∪,-,∩,×)和专门的关系运算(σ选择,П投影, ⋈ 连接,÷)两类

原文地址:https://www.cnblogs.com/chenguosong/p/12055856.html