数据库系统原理第一章数据库系统的基本概念

一、数据管理技术的发展

在使用计算机后,数据处理的速度和规模是手工方式或机械方式无可比拟的,随着数据处理量的增长,产生了数据管理技术。数据管理技术的发展经历了人工管理、文件系统、数据库和高级数据库阶段。

1、人工管理阶段:时间段(20世纪50年代中期以前),这个时期的数据管理有以下特点:

(1)数据不保存在计算机内。计算机主要用于计算,一般不需要长期保存数据。在进行某一课题计算时,将原始数据随程序一起输入内存,运算处理后将结果数据输出。随着计算任务的完成,用户作业退出计算机系统,数据空间随着程序空间一起被释放。
(2)没有专用的软件对数据进行管理。每个应用程序都要包括存储结构、存取方法、输入输出方式等内容。程序中的存取子程序随着存储结构的改变而改变,因而数据与程序不具有独立性。存储结构改变时,应用程序必须改变。因此数据的逻辑结构和物理结构没有区别。
(3)只有程序(program)的概念,没有文件(file)的概念。数据的组织方式必须由程序员自行设计与安排。
(4)数据面向程序。即一组数据对应一个程序。

2、文件系统阶段:时间段(20世纪50年代后期至60年代后期)

(1)数据以“文件”形式可长期保存在外部存储器的磁盘上。由于计算机的应用专享信息管理,因此对文件要进行大量的查询、修改和插入等操作。
(2)、数据的逻辑结构和物理结构有了区别,但比较简单。程序与数据之间具有“设备独立性”,即程序只需用文件名既可以数据打交道,不比关系数据的物理位置。有操作系统的文件系统提供存取方法(读/写)。
(3)文件组织已多样化。有索引文件、链文件和之间存取文件等。单文件之间相互独立、缺乏联系。数据之间的联系要通过程序去改造。
(4)数据不在属于某个特定的程序,可以重复使用,即数据面向应用。但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变。
在文件系统阶段,由于具有社保的独立性,因此当改变存储社保是,不必改变应用成功能行。但这只是初级的数据管理,还未能彻底体现用户观点下的数据逻辑结构独立于数据在外存的物理结构要求。在数据的物理结构修改是,仍然需要修改用户的应用程序,即应用程序具有“程序——数据依赖性”。有关物理标识的知识和访问技术将直接体现在应用程序的代码中。
(5)对数据的操作以记录为单位。这是由于文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取、查询、插入、删除、修改等所有操作,都要用程序来实现。
文件系统阶段是数据库管理技术发展中的一个重要阶段。在这一阶段中,得到充分发展的数据结构和算法丰富了计算机科学,为数据库管理技术进一步发展打下了基础,现在仍是计算机软件科学的重要基础。
但是,随着数据管理的规模扩大,数据量的急剧增加,文件系统显露出三个缺陷:
①、数据冗余(Redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。
②、数据不一致(Inconsistency)。这往往是由数据冗余造成的,在进行更新操作是,稍有不谨慎,就可能使同样的数据在不同的文件中显示的结果不一样。
③、数据联系弱(PoorData Relationship)。这是由于文件之间相互独立,缺乏联系造成的。

3、数据库阶段:时间段(20世纪60年代末)

20世纪60年代中期出现的系统(Database或Databank)还不能真正的成为数据库系统。数据管理技术进入数据库阶段的标志是20世纪60年代末的三大事件:
(1)1968年美国IBM公司推出层次模型的IMS(Infomation Management System)
(2)1969年美国CODASYL(Conference On Data System Language) 组织发布了DBTG(Data Base Task Group)报告。总结了当时各式各样的数据库,踢出网状模型,尔后于1971年4月正式通过。
(3)1970年美国IBM公司的E.F.Cod连续发布论文,提出关系模型。奠定了关系数据库的理论基础。

数据库阶段的数据管理特点:

1、采用数据模型表示复杂的数据结构。数据模型不仅描述数据本身的特征,还要描述数据之间的联系。这种联系通过存取路径实现。通过所有存取路径表示自然的数据联系是数据库与传统文件的区别。 这样,数据不在面向特定的某个或多个应用,而是面向整个应用系统。数据冗余明显减少,实现了数据共享。
(2)有较高的数据独立性。数据的逻辑结构和物理结构之间的差别可以很大。用户以简单的逻辑操作数据而无须考虑数据的物理结构。数据库的结构分成用户的局部逻辑结构、数据库的整体逻辑结构和物理结构三级。用户(应用程序或终端)的数据和外存中的数据之间转换由数据库管理系统实现。
 
 
(3)数据库系统为用户提供了方便的用户接口。用户可以使用查询语言或者终端命令操作数据库,也可以使用程序方式(如用COBOL、C一类高级语言和数据库语言联合编制的程序)操作数据库。
(4)数据库系统提供一下四个方面的数据库控制功能:
①数据库的恢复:在数据库被破坏或数据库不可靠时,系统有能力把数据库恢复到最近某个正确状态。
②数据库的并发控制:对程序的并发操作加以控制,防止数据库被破坏,杜绝提供给用户不正确的数据。
③数据的完整性:保证数据库中数据始终是正确的。
④数据安全性:保证数据的安全,防止数据丢失或被窃取、破坏。
(5)增加系统的灵活性:对数据的操作不一定以记录为单位,可以以数据项为单位。
定义1.1数据库(Database,简记为DB)
DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。
定义1.2数据库管理系统(Database Management System,简记为DBMS)
DBMS是位于用户与操作系统(OS)之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新以及各种数据控制。
DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型和面向对象型等。
 
(=======================系统层次图=========================)
 
定义1.3数据库系统(Database System,简记为DBS)
 
DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问计算机的硬件、软件和数据库资源组成的系统,即它是采用数据库技术的计算机系统。
定义1.4数据库系统
数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。
数据库技术是在操作系统的文件系统基础上发展起来的,而且DBMS本身要在操作系支持下才能工作。
4、高级数据库阶段:
高级数据库阶段的主要标志是20世纪80年代的分布式数据库系统、90年代的对象数据库系统以及21世纪的Web数据库系统。
1、面向对象的概念建模
在数据处理领域,关系数据库的使用已相当普遍、相当出色。但是现实世界存在着许多洁颜油更复杂的数据结构的实际应用领域,已有的层次、网状、关系等三种数据模型对这些应用领域都显得力不从心。随着面向对象技术的渗透,数据库的概念建模经历了从实体联系图、对象联系图到UML类图的发展历程,以适应具有面向对象特征的数据库系统的需要。
2、开放数据库互联技术
现在,计算机网络已成为信息化社会中十分重要的基础设施。在网络中,各个节点的DBMS可能不一样,因此有必要建立一个公告的、与DBMS型号无关的应用程序设计接口。这个接口为开发者提供单一的编程接口,使得同一个应用程序能够访问不同的数据库服务器。这种技术成为“开放数据库互联”技术。
 
 
原文地址:https://www.cnblogs.com/itor/p/7238033.html