数据库模式是通过一系列定义来说明的,这些定义由一种称作数据定义语言(Data?Definition Language,DDL)的特殊语言来表达。DDL也可用于定义数据的其他特征。数据库系统所使用的存储结构和访问方式是通过一系列...
1.4 数据库语言数据库系统提供数据定义语言(data?definition language)来定义数据库模式,以及数据操纵语言(data?manipulation language)来表达数据库的查询和更新。9而实际上,数据定义和数据操纵语言...
数据库结构的基础是数据模型(data model)。数据模型是一个描述数据、数据联系、数据语义以及一致性约束的概念工具的集合。数据模型提供了一种描述物理层、逻辑层以及视图层数据库设计的方式。下文中,我们将提...
随着时间的推移,信息会被插入或删除,数据库也就发生了改变。特定时刻存储在数据库中的信息的集合称作数据库的一个实例(instance)。而数据库的总体设计称作数据库模式(schema)。数据库模式即使发生变化,也...
1.3 数据视图数据库系统是一些互相关联的数据以及一组使得用户可以访问和修改这些数据的程序的集合。数据库系统的一个主要目的是给用户提供数据的抽象视图,也就是说,系统隐藏关于数据存储和维护的某些细节。1...
数据库系统作为商业数据计算机化管理的早期方法而产生。作为20世纪60年代这类方法的典型实例之一,考虑大学组织中的一个部分,除其他数据外,需要保存关于所有教师、学生、系和开设课程的信息。在计算机中保存这...
数据库的应用非常广泛,以下是一些具有代表性的应用:? 企业信息□ 销售:用于存储客户、产品和购买信息。□ 会计:用于存储付款、收据、账户余额、资产和其他会计信息。□ 人力资源:用于存储雇员﹑工资﹑...
数据库管理系统(DataBase?Management System, DBMS)由一个互相关联的数据的集合和一组用以访问这些数据的程序组成。这个数据集合通常称作数据库(database),其中包含了关于某个企业的信息。DBMS的主要目标...
出版者的话译者序前言第1章引言1.1数据库系统的应用1.2数据库系统的目标1.3数据视图1.3.1数据抽象1.3.2实例和模式1.3.3数据模型1.4数据库语言1.4.1数据操纵语言1.4.2数据定义语言1.5关系数据库1.5.1表1.5.2数据操...
数据库管理已经从一种专门的计算机应用发展为现代计算环境中的一个重要成分,因此,有关数据库系统的知识已成为计算机科学教育中的一个核心的部分。在本书中,我们讲述数据库管理的基本概念。这些概念包括数据库...
数据库系统是对数据进行存储、管理、处理和维护的软件系统,是现代计算环境中的一个核心成分。随着计算机硬件、软件技术的飞速发展和计算机系统在各行各业的广泛应用,数据库技术的发展尤其迅速,引人注目。有关...
文艺复兴以降,源远流长的科学精神和逐步形成的学术规范,使西方国家在自然科学的各个领域取得了垄断性的优势;也正是这样的传统,使美国在信息技术发展的六十多年间名家辈出、独领风骚。在商业化的进程中,美国...
本书是经典的数据库系统教科书《Database System Concepts》的最新修订版,全面介绍数据库系统的各种知识,透彻阐释数据库管理的基本概念。本书内容丰富,不仅讨论了关系数据模型和关系语言、数据库设计过程、...
数据预处理在许多教科书中都有讨论,包括English[Eng99],Pyle[Pyl99],Loshin[Los01],Redman[Red01],以及Dasu和Johnson[DJ03]。预处理技术的更多专门文献在下面给出。关于数据质量的讨论见Redman[...
3.1 数据质量可以从多方面评估,包括准确性、完整性和一致性问题。对于以上每个问题,讨论数据质量的评估如何依赖于数据的应用目的,给出例子。提出数据质量的两个其他尺度。3.2 在现实世界的数据中,某些属性...
?·数据质量用准确性、完整性、一致性、时效性、可信性和可解释性定义。质量基于数据的应用目的评估。?·数据清理例程试图填补缺失的值,光滑噪声同时识别离群点,并纠正数据的不一致性。数据清理通常是一个两...
现在,我们考察标称数据的数据变换。特别地,我们研究标称属性的概念分层产生。标称属性具有有穷多个不同值(但可能很多),值之间无序。例如地理位置、工作类别和商品类型。对于用户和领域专家而言,人工定义概...
聚类、决策树和相关分析可以用于数据离散化。我们简略讨论这些方法。聚类分析是一种流行的离散化方法。通过将属性A的值划分成簇或组,聚类算法可以用来离散化数值属性A。聚类考虑A的分布以及数据点的邻近性,因此...
像分箱一样,直方图分析也是一种非监督离散化技术,因为它也不使用类信息。直方图已在2.2.3节介绍过。直方图把属性A的值划分成不相交的区间,称做桶或箱。可以使用各种划分规则定义直方图(3.4.6节)。例如,在等...
分箱是一种基于指定的箱个数的自顶向下的分裂技术。3.2.2节讨论了数据光滑的分箱方法。这些方法也可以用作数据归约和概念分层产生的离散化方法。例如,通过使用等宽或等频分箱,然后用箱均值或中位数替换箱中的每...