这两天,在研究 SQL 语法中的 inner join 多表查询语法的用法,通过学习,发现一个 SQL 命令,竟然涉
及到很多线性代数方面的知识,现将这些知识系统地记录如下:
使用关系代数合并数据
1 关系代数
合并数据集合的理论基础是关系代数,它是由 E.F.Codd 于 1970 年提出的。
在关系代数的形式化语言中:
? 用表、或者数据集合表示关系或者实体。
? 用行表示元组。
? 用列表示属性。
关系代数包含以下 8 个关系运算符
? 选取――返回满足指定条件的行。
? 投影――从数据集合中返回指定的列。
? 笛卡尔积――是关系的乘法,它将分别来自两个数据集合中的行以所有可能的方式进行组合。
? 并――关系的加法和减法,它可以在行的方向上合并两个表中的数据,就像把一个表垒在另一个
表之上一样。
? 交――返回两个数据集合所共有的行。
? 差――返回只属于一个数据集合的行。
? 连接――在水平方向上合并两个表,其方法是:将两个表中在共同数据项上相互匹配的那些行合
并起来。
? 除――返回两个数据集之间的精确匹配。
此外,作为一种实现现代关系代数运算的方法,SQL 还提供了:
? 子查询――类似于连接,但更灵活;在外部查询中,方式可以使用表达式、列表或者数据集合的
地方都可以使用子查询的结果。
本章将主要讲述多种类型的连接、简单的和相关的子查询、几种类型的并、关系除以及其他的内容。
2 使用连接
2.1 连接类型
在关系代数中,连接运算是由一个笛卡尔积运算和一个选取运算构成的。首先用笛卡尔积完成对两个数据
集合的乘运算,然后对生成的结果集合进行选取运算,确保只把分别来自两个数据集合并且具有重叠部分
的行合并在一起。连接的全部意义在于在水平方向上合并两个数据集合(通常是表),并产生一个新的结
果集合,其方法是将一个数据源中的行于另一个数据源中和它匹配的行组合成一个新元组。
SQL 提供了多种类型的连接方式,它们之间的区别在于:从相互交叠的不同数据集合中选择用于连接的
行时所采用的方法不同。
连接类型ÕÕÕÕÕÕÕÕÕÕ定义
内连接ÕÕÕÕÕÕÕÕÕÕ只连接匹配的行
左外连接ÕÕÕÕÕÕÕÕÕÕ包含左边表的全部行(不管右边的表中是否存在与它们匹配的行),以及右边表中全部匹
配的行
右外连接ÕÕÕÕÕÕÕÕÕÕ包含右边表的全部行(不管左边的表中是否存在与它们匹配的行),以及左边表中全部匹
配的行
全外连接ÕÕÕÕÕÕÕÕÕÕ包含左、右两个表的全部行,不管另外一边的表中是否存在与它们匹配的行。
(H)(theta)连接ÕÕÕÕÕÕÕÕÕÕ使用等值以外的条件来匹配左、右两个表中的行
交叉连接ÕÕÕÕÕÕÕÕÕÕ生成笛卡尔积-它不使用任何匹配或者选取条件,而是直接将一个数据源中的每个行与另
一个数据源的每个行都一一匹配
在 INFORMIX 中连接表的查询