type
status
date
slug
summary
tags
category
icon
password
数据库概述
数据库的4个基本概念
- 数据(Data)
- 数据库 DB(DataBase)
- 数据库关系系统 DBMS(DataBase Managemet System)
- 数据库系统DBS(DataBase System)
数据的定义
描述事物的符号记录。
数据的含义称为语义,数据与语域是不分割的。
种类:文字,图形,音频,视频,学生记录档案,货物运输情况等。
数据库的定义
长期存储在计算机内,有组织,可共享的大数据的集合。
数据库的基本特征:
数据按一定的数据模型组织,描述和存储。
可为各种用户共享。
冗余度较小。
数据独立性较高。
易扩展。
数据库管理系统的定义
位于用户与操作系统间的一层数据管理软件。
是基础软件,是一个大型复杂的软件系统。
用途:科学地组织数据,高效地获取和维护数据。
数据库管理系统主要包括哪几个功能?
数据定义功能。
数据组织,存储和管理。
数据操纵功能。
数据库的事务管理和运行管理。
数据库的建立和维护功能。
其他功能。
数据库管理系统——数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象。
数据库管理系统——数据组织,存储和管理
分类组织,存储和管理各种数据。
确定组织数据的文件结构和存取方式。
实现数据之间的联系。
提供多种存取方法提高存取效率。
数据库管理系统——数据操纵功能
提供数据操纵语言(DML)
实现数据库的基本操作(查询,插入,删除和修改)
数据库管理系统——数据库的事物管理和运行管理
数据库在建立,运行和维护时由数据库管理系统统一管理和控制。
保证数据安全性,完整性,多用户对数据的并发使用。
发生故障后的系统恢复。
数据库管理系统——数据库的建立和维护功能
数据库初始数据的装载和装换。
数据库转存,恢复功能。
数据库的重组织。
性能监视,分析等。
数据库管理系统——数据库的其它功能
数据库管理系统与网络中其他软件系统的通信。
数据库管理系统与其他系统之间的数据转换。
异构数据库之间的互访和互操作。
数据库系统的定义
是由数据库,数据库管理系统(及应用开发工具),应用程序和数据库管理员(DataBase Administrator,DBA)组成的存储,管理,处理和维护数据的系统。
什么是数据管理
对数据进行分类,组织,编码,存储,检索和维护。
是数据处理的中心问题。
数据管理技术的发展过程
人工管理阶段(20世纪50年代中之前)
文件系统阶段(20世纪50年代末—60年代中)
数据库系统阶段(20世纪60年代末—现在)
数据管理技术的发展动力
应用需求的推动
计算机硬件的发展
计算机软件的发展
数据库系统的特点
数据结构化。
数据的共享性高,冗余度低且易扩充。
数据独立性高。
数据有数据库管理系统统一管理和控制。
整体结构化
不仅仅针对某一应用,而是面向全组织。
不仅数据内部结构化,整体是结构化,数据之间具有联系。
数据记录可以变长
数据的最小存取单位是数据项。
数据用数据模型描述,无需应用程序定义。
共享性高,冗余度高,易扩充
面向整个系统,可以被多个用户,应用共享。
共享的好处:减少冗余,节约空间,避免数据间不相容性与不一致性。
使系统易于扩充。
物理独立性
指用户应用程序与数据库中的数据的物理地址相互独立的。
数据的物理存储改变,应用程序不用变。
逻辑独立性
指用户的应用程序与数据库的逻辑是相互独立的。
数据的逻辑结构改变,应用程序不用改变。
数据的独立性是由什么的保证的?
二级印象功能。
数据库管理系统提供的数据控制功能
安全性保护:防止不法使用,破坏和泄密。
完整性检查:保证数据的有效性,正确性,相容性。
并发控制
对多用户操作加以控制和协调,防止相互干扰。
数据库恢复
从错误状态恢复到某一已知的正确态度。
数据模型
数据模型
对现实世界数据特征的抽象,即对现实世界的模拟。
数据模型是数据库系统的核心和基础。
数据模型应满足
能比较真实的模拟现实世界。
容易为人所理解。
便于在计算机上实现。
概念模型
信息模型,按用户的观点来对数据和信息建模,用于数据库设计。
逻辑模型
网状模型,层次模型,关系模型,面向对象数据模型,对象关系模型,半结构化数据模型等。
按计算机系统观点建模,用于DBMS实现。
物理模型
对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法;在磁盘或磁带上的存储方式或存取方法。
客观对象的抽象过程——两步抽象
现实世界的「客观对象」抽象为「概念模型」:将现实世界抽象为信息世界。
把「概念模型」转换为某一数据库管理系统所支持的「数据模型」:将信息世界转换为机器世界。
概念模型的用途
信息世界建模。
现实世界到机器世界的一个中间层次。
数据库设计的有力工具。
数据库设计人员和用户之间交流的语言。
对概念模型的基本要求
较强的语义表达能力。
简单,清晰,易于用户理解。
概念模型的一种表示方法
实体-联系方法
实体(Entity)的定义
客观存在并可相互区别的事物。
可以是具体的人,事,物或抽象的概念。
属性(Attribute)的定义
实体所具有的某一特性。
一个实体可由若干属性来刻画。
码(key)
唯一标识实体的属性集。
实体型(Entity type)的定义
用实体名及其属性名集合来抽象和刻画同类实体。
例如:学生(学号,姓名,性别,出生年月,所在院系)就是一个实体型。
实体集(Entity Set)
同一类型的集合。
全体学生就是一个实体集合。
练习(Relationship)的定义
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。
内部联系:各属性之间的联系。
外部联系:实体集之间的联系。
实体之间的联系有
一对一
一对多
多对多
实体-联系方法(Entity-Relationship Approach)
用E-R图来描述现实世界的概念模型。
E-R方法也称为E-R模型。
数据模型的组成要素
数据结构,数据操作,数据的完整性约束条件。
数据模型的数据结构
描述数据库的组成对象,以及对象之间的关系。
数据结构是对系统静态性的描述。
数据模型用的数据结构描述的内容
与对象的类型,内容,性质有关。
与数据之间联系有关。
数据操作
对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。
操作是对系统动态特性的描述。
数据操作的类型
查询
更新(插入,删除,修改)
数据模型对操作的定义
操作的确切含义
操作符号
操作规则(如优先级)
实现操作的语言
数据的完整性约束条件
一组完整性规则的集合。
用以限定符合数据库模型的数据库状态的变化,以保证数据的正确,有效和相容。
完整性规则:
给定的数据模型中数据及其联系所具有的制约和依存规则。
数据模型对完整性约束条件的定义
反映和规定必须遵守的基本的通用的完整性约束条件。
提供了定义完整性约束机制,来反映具体应用所涉及的数据必须遵守的语义约束条件。
提供定义完整性约束条件机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
常用的数据模型
层次,网状,关系,面向对象,对象关系,半结构化。
层次模型的定义
采用树形结构来表示实体间的联系。
有且只有一个结点没有双亲节点,这个结点称为根节点。
根以外的结点都只有一个双亲结点。
层次模型的优点
数据结构比较简单清晰。
查询效率高,性能优于关系模型,低于网状
层次数据模型提供良好的完整性支持。
层次模型的缺点
处理多对多的结点不太自然。
插入删除限制多,对程序的编写复杂。
查询子女必须通过双亲节点。
层次命令趋于程序化。
网状模型的定义
数据库系统采用网状模型。
允许一个以上的节点无双亲。
一个节点可以有多个双亲。
网状和层次数据结构的表示方法
实体型:记录类型描述,每个结点表示一个记录类型(实体)。
属性:用字段描述,每个记录类型可以包含若干个字段。
联系:用结点之间的连线表示记录类型之间的联系。
网状模型的优点
能够更直接地描述现实世界,如一个结点可以有多个双亲。
具有良好的性能,存取率较高。
网状模型的缺点
结构复杂,随着后面的扩充,数据库结构会越来越复杂,最后会不利用用户掌握。
操作语言复杂,不利用用户使用。
记录间通过路径存取,用户必须了解系统结构的细节。
关系模型中的关系,元组,属性,主码
关系:一张表。
属性:表中的一列,给每个属性起个名字即属性名。
主码:也称码键,补充某个属性组,它可以唯一确定一个元组。
关系模型的域,分量,关系模式的定义
域:是一组具有相同数据类型的值的集合,属性的取值地。
分量:元组中的一个属性值。
关系模式:对关系的描述。例 关系名(属性1,属性2…属性n)
关系模式中最基本的规范条件
关系每个分量必须是一个不可分的数据项,不允许表中还有表。
关系数据模型的操作
数据的操作是集合操作,操作对象和操作结果都是关系。
查询,插入,删除,更新。
关系的完整性约束条件
参照完整性
实体完整性
用户定义完整性
关系模型的优点
严格的数学支撑:建立在严格的数学逻辑概念基础上
概念单一:实体和各类联系都用管写成表示,对数据的检索结果也是关系。
关系模型的存取路径对用户透明:更高的数据独立性,安全保密性,简化了程序员的工作和数据时开发建立。
关系模型缺点
存取路径对用户透明,查询效率往往不如格式化数据模型。
为提高性能,必须对用户数据的查询请求进行优化,增加了开发数据库管理系统的难度。
从数据库开发人员的角度看,数据库通常采用三级模式结构
外模式,模式,内模式
从数据库最终用户角度看,数据库分为
单用户结构。
主从式结构。
分布式结构。
客户-服务器。
浏览器-应用服务器/数据库服务器多层结构等。
型合值的概念
型:对某一类数据的结构和属性的说明。
值:是型的一个具体的赋值。
里型:学生(学号,姓名,年龄)
值:(20012,李牧,19)
数据库的模式
数据库逻辑结构和特征的描述。
是型的描述,不涉及具体值。
反映的是数据的结构及其联系。
模式是相对稳定的。
数据库的实例
模式的一个具体值。
反映数据库某一时刻的状态。
同一个模式可以有很多实例。
实例随数据库中的数据更新而变动。
数据库的三级模式
逻辑模式的定义
数据库中全体数据的逻辑结构和特征的描述。
所有用户的公共数据视图。
一个数据库只有一个模式
外模式的定义
数据库用户使用的局部数据的逻辑结构和特征描述。
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
外模式的地位
介于模式和应用之间
模式与外模式的关系:一对多。
外模式与应用的关系:一对多。
外模式的用途
保证数据安全性的一个有力措施。
每个用户只能看见和访问所应对的外模式的数据。
内模式的定义
物理结构和存储方式的描述。
数据在数据库内部的表现方式。
数据库的二级映像
外模式/模式映像
模式/内模式映像
映像的定义通常包含在外模式的描述中。
外模式/模式映像的作用
保证数据的独立性。
模式改变时,外模式保持不变,应用程序不必修改。
模式/内模式的作用
定义了数据全局逻辑结构与存储结构之间的对应关系。
说明逻辑字段和记录在内部是如何表示的。
该映像通常包含在模式描述中。
保证数据的物理独立性。
用户的定义
偶然用户:平时不怎么用,用是需要访问不同的数据库。企业管理机构的高中级管理人员。
简单用户:主要工作是查询和更新数据库。银行职员,前台服务员。
复杂用户:直接访问数据库,并能用编程语言编写程序。工程师,科学家,经济学家,科技工作者等。