(3) SELECT 基础查询
1.1 表格、纪录与栏位
表格是资料库储存资料的基本元件,它是由一些栏位组合而成的,储存在表格中的每一笔纪录就拥有这些栏位的资料。以储存城市资料的表格「city」来说,设计这个表格的人希望一个城市资料需要包含编号、名称、国家代码、区域和人口数量,所以他为「city」表格设计了这些「栏位(column)」:
储存在表格中的每一笔资料称为「列(row)」或「纪录(record)」:
在设计表格的时候,通常会指定一个栏位为「主索引键(primary key)」:
注:主索引键会在「第八章、表格与索引」中详细的讨论。
1.2 认识资料型态
资料库中可以储存各种不同的资料,SQL提供许多不同的「资料型态」让你应付这些不同的需求。在开始查询资料之前,你要先认识最常见、也是最基本的资料型态。第一种是数值,为了更精准的保存数值资料,SQL提供整数与小数两种数值型态:
你可以依照自己的需求,使用储存的数值资料执行数学运算:
常用的资料型态还有「字串」与「日期」:
在SQL叙述中使用字串资料的时候,字串资料的前后要使用单引号或双引号:
使用日期资料的时候,MySQL资料库预设的日期格式是「年-月-日」。与字串资料一样,前后也要使用单引号或双引号:
注:字串与日期资料型态会在「第七章、储存引擎与资料型态、栏位资料型态」中详细的讨论。
另外一种在资料库中比较特殊的资料型态是「NULL」,它不像数值、字串或日期资料型态是一个明确的资料,「NULL」是用来表示「不确定」、「未知」或「没有」的资料:
2 查询叙述
在执行资料库的操作中,查询算是最常见也是最复杂的工作,所以一个查询叙述所使用到的子句也最多,下列是查询叙述的基本语法:
这一章会讨论「SELECT」、「FROM」、「WHERE」、「ORDER BY」和「LIMIT」五个子句组合起来的查询叙述。其它的子句会在下一章继续讨论。
在你使用「SELECT」搭配各种子句来查询资料时,要特别注意子句使用的顺序:
就算你每一个子句的写法都没有出错,如果顺序不对了:
2.1 指定使用中的资料库
一个资料库伺服器可以建立许多需要的资料库,所以在你执行任何资料库的操作前,通常要先指定使用的资料库。下列是指定资料库的指令:
如果你使用「MySQL Workbench」这类的工具软体,画面上看起来会像这样:
2.2 只有SELECT
一个SQL查询叙述一定要以「SELECT」子句开始,再搭配其它的子句完成查询资料的工作。你可以单独使用「SELECT」子句,只不过这样的用法跟资料库一点关系都没有,它只不过把你输入的内容显示出来而已:
例如下列的查询叙述,只是简单的显示字串和计算结果,并不会查询资料库中的资料:
SELECT 'My name is Simon Johnson', 35 * 12
2.3 指定栏位与表格
一般所谓的查询叙述,通常是查询资料库中的资料,所以「SELECT」子句会搭配「FROM」子句来使用,而「SELECT」后面可以指定「*」表示要查询指定表格的所有栏位:
如果目前使用中的资料库为「world」,下列的叙述可以查询「world」资料库中,「city」表格的所有资料:
SELECT * FROM city
一个资料库伺服器可以建立许多需要的资料库,所以在你执行任何资料库的操作前,都要使用「USE」叙述指定一个使用中的资料库。不过你也可以在SQL叙述中使用下列的语法来指定资料库:
如果目前使用中的资料库是「world」,你不用先使用「USE cmdev」叙述切换使用中的资料库,可以使用下列的语法查询「cmdev」资料库中的「emp」表格:
SELECT * FROM cmdev.emp
2.4 指定需要的栏位
有时候你并不需要查询一个表格中所有的栏位,所以你可以在「SELECT」子句后面自己指定需要的栏位:
如果你在「SELECT」后面使用「*」的话:
你可以依照自己的需要决定要查询哪些栏位和顺序:
2.5 数学运算
除了查询表格中的栏位外,你可以加入任何需要的运算,这里先讨论一般常见的数学运算。下列是很常用来执行数学运算的运算子:
优先顺序 | 运算子 | 说明 | 范例 | 运算结果 |
---|---|---|---|---|
1 | % | 余数 | 7 % 3 | 1 |
1 | MOD | 余数 | 7 MOD 3 | 1 |
1 | * | 乘 | 7 * 3 | 21 |
1 | / | 除 | 7 / 3 | 2.333 |
1 | DIV | 除(整数) | 7 DIV 3 | 2 |
2 | + | 加 | 7 + 3 | 10 |
2 | - | 减 | 7 – 3 | 4 |
注:优先顺序的数字从1开始,1表示优先权比较高,2比较低,以此类推。就跟一般数学运算的先乘除后加减一样:在一个运算式中,优先权高的先算完,再换低优先权继续算;同样优先权的就由左到右计算。你也可以在运算式中使用左右括号,括号中的运算会先执行。
以「cmdev」资料库中的员工表格(emp)来说,想要计算员工的年薪,就可以使用这些运算子来完成你的查询工作:
2.6 别名
你可以另外为「SELECT」后面查询的资料取一个自己想要的名称,这个作法称为「别名(alias
name)」:
取栏位别名会让执行查询后的结果,使用你自己取的名称为栏位名称:
注:帮一般栏位取一个栏位别名是比较没有必要的,如果是运算式的话,通常就要帮它取一个栏位别名来取代原来一大串的运算式。
在取栏位别名的时候要特别注意下列的状况:
另外如果你「坚持」要使用SQL语法中的保留字来当作栏位别名的话:
如果违反上列两个规定,执行叙述以后会发生错误。
3 条件查询
使用「SELECT」和「FROM」执行的查询叙述,是把你在「FROM」子句指定表格里所有的纪录传回来。资料库最大的好处就是可以随时依照需要查询部份纪录资料,你可以搭配「WHERE」子句执行查询条件的设定:
3.1 比较运算子
要使用「WHERE」执行查询条件的设定,你会使用下列基础的比较运算子:
|优先顺序 |运算子| 说明|
|1| =| 等于|
|1| `| 等于| |1|
!=| 不等于| |1| ``| 大于| |1|
>=`| 大于等于|
注:``运算子在后面「NULL值的判断」会讨论。
使用这些基础的比较运算子就可以完成一些简单的条件设定:
设定日期资料型态的条件也是很常见的:
3.2 逻辑运算子
查询条件的设定,有时候会像前面讨论的单一条件一样,并不会太复杂;不过也很常遇到在一个查询的需求中,需要设定一个以上的条件,那你就会用到下列的运算子:
优先顺序 | 运算子 | 说明 |
---|---|---|
1 | NOT | 非 |
2 | && | 而且 |
2 | AND | 而且 |
3 | | | |
或 |
3 | OR | 或 |
3 | XOR | 互斥 |
「NOT」运算子比较特殊一些,在一般的需求中,比较不会用到它。以下列的需求来说:
如果想要查询国家代码是「TWN」,而且人口数量小于十万的城市,就必须设定两个条件,而两个条件之间,依照「而且」的需求,使用「AND」来结合两个条件:
如果想要查询国家代码是「TWN」或是「USA」的城市,在两个条件之间依照「或」的需求,使用「OR」来结合两个条件:
在逻辑运算子的介绍中,它们也同样有「优先顺序」的。如果你想要查询在欧洲(Europe)或非洲(Aftica)国家,而且人口数要小于一万。使用下列的查询条件所得到的资料,跟你想要的却不一样:
如果有多个查询条件的设定,全部都是「AND」或全部都是「OR」的话,就没有这类问题;如果查询条件中,有「AND」和「OR」同时出现的话,就要依照你的需要,视情况加上左右刮号来控制条件的设定:
3.3 其它条件运算子
一般的条件和逻辑运算子,已经可以应付大部份的查询条件需求。下列还有一些可以用在特殊用途或是提供替代写法的条件设定:
- BETWEEN … AND …:范围比较
- IN (…):成员比较
- IS:是…
- IS NOT:不是…
- LIKE:像…
「BETWEEN … AND …」用来执行一个指定范围条件的设定:
如果要查询人口数量在八万到九万之间的城市资料,可以有下列两种条件的写法,它们执行以后的结果是完全一样的:
使用「BETWEEN … AND …」的条件设定会包含指定的资料,所以下列两个查询条件所得到的结果就不一样了:
「BETWEEN … AND …」使用在日期资料时,也可以完成某一个日期范围的判断:
「IN (…)」使用在一组成员资料的比对条件设定:
下列两个查询叙述,都可以得到国家代码是「TWN、USA、JPN、ITA和KOR」的城市资料,可是使用「IN (…)」来设定条件的话,看起来会简洁很多:
3.4 NULL值的判断
在国家表格中,有一个储存平均寿命的栏位「LifeExpectancy」,不过资料库中的资料并没有很完整,所以有一些国家是没有这个资料的,所以会使用「NULL」值来表示:
如果想要查询没有平均寿命资料的国家,也就是平均寿命的栏位值是「NULL」,你可能会使用下列的叙述:
SELECT Name, LifeExpectancy
FROM country
WHERE LifeExpectancy = NULL
上列的叙述执行以后,并没有传回任何纪录,这表示并没有资料符合你设定的查询条件。
所以「NULL」值的判断,不可以使用判断一般资料的条件设定:
注:``在判断一般资料的时候,跟「=」完全一样;不过它用在判断「NULL」资料的时候,效果跟「IS」一样。
如果换成要查询「有」平均寿命资料的国家,也就是平均寿命的栏位值不是「NULL」:
3.5 字串样式
在使用字串资料的条件判断时,会有一种很常见、也比较特殊的需求,像是「想要查询名称以w字元开始的城市」,如果你使用下列的查询叙述:
SELECT Name FROM city WHERE Name = 'w'
这样的查询条件,当然不是「名称以w字元开始的城市」,而是名称只有一个「w」字元的城市。所以这类的查询就会使用下列这个特殊的条件设定:
上列语法中,在「LIKE」后面的「样版」字串中,会使用到下列两种「样版字元」:
- %:0到多个任何字元
- _ :一个任何字元
所以要查询「名称以w字元开始的城市」的话:
参考上列的作法,就可以延伸出其它的查询条件设定了:
上列的查询条件中,「w%」表示第一个字元是「w」就符合条件;「%w」表示最后一个字元是「w」就符合条件;最后一个「%w%」表示不论在什么位置有「w」字元,都符合条件。
另外一种样版字元「_」表示一个任何字元:
把这些样版中的底线换到后面的话:
你也可以搭配两种样版字元完成条件的设定:
甚至像查询「名称是三十(包含)个字元以上的城市」:
注:其实完成上列的查询条件的需求是不用这么麻烦的,在后面的章节会讨论比较简单的方式。
4 排序
在你执行任何一个查询以后,MySQL传回的资料是依照「自然」的顺序排列的。所谓的自然顺序,通常是资料新增到表格中的顺序,可是在资料库运作一段时间后,陆续会有各种不同的操作,所以这个「自然」顺序对你来说,通常是没什么意义的。
一般的查询通常会有资料排序上的需求,所以你会使用「ORDER BY」子句:
如果你希望在查询城市资料的时候,资料库会依照国家代码帮你排序的话:
你也可以指定资料排列的顺序为由大到小:
「ORDER BY」子句后面可以依照需求指定多个排序的资料:
「ORDER BY」子句后面指定多个排序资料的时候,都可以依照需求,各自指定资料排列的方式:
「ORDER BY」子句指定的资料可以是栏位名称、编号、运算式或是栏位别名:
虽然比较不会有下列这样的需求,不过你还是可以这样作:
注:资料排列的顺序在「第六章、字元集与资料库」与「第七章、储存引擎与资料型态」中进一步详细的讨论。
5 限制查询
5.1 指定回传纪录数量
在你执行一个查询叙述后,资料库会将你查询的资料传回来给你;如果你使用「WHERE」子句设定查询条件的话,资料库就只会传回符合条件的资料;除了上列的状况外,你也可以另外使用「LIMIT」子句指定回传纪录的数量:
如果你在「LIMIT」子句后面指定一个数字:
「LIMIT」子句后面也可以指定两个数字:
在查询叙述中,使用「ORDER BY」子句搭配「LIMIT」子句,就可以完成下列查询「排名」的工作:
注:如果出现类似「… LIMIT 1000000, 10」这样的查询叙述,虽然你只会得到十笔资料,资料库总共会查询一百万零一十笔资料,只不过资料库会帮你跳过前一百万笔;类似这样的需求,还是要使用「WHERE」子句先挑出想要的资料会比较好一些。
5.2 排除重复纪录
在一个查询叙述执行以后,资料库不会帮你检查回传的资料是否重复(回传的两笔纪录资料完全一样),在「SELECT」子句后面可以让你设定「回传的资料是否重复」:
没有使用「ALL」或「DISTINCT」的效果,跟你自己加上「ALL」的查询效果是一样的,资料库会依照你的查询传回所有的资料:
使用「DISTINCT」的话,资料库会特别执行回传纪录是否重复的检查: