更新了关系型数据库的文档

pull/279/head
jackfrued 2019-08-08 00:56:43 +08:00
parent 9e7382d36d
commit 77e68052f6
1 changed files with 540 additions and 24 deletions

View File

@ -2,7 +2,7 @@
### 关系数据库概述
1. 数据持久化 - 将数据保存到(在掉电情况下)能够长久保存数据的存储介质中。
1. 数据持久化 - 将数据保存到能够长久保存数据的存储介质中,在掉电的情况下数据也不会丢失
2. 数据库发展史 - 网状数据库、层次数据库、关系数据库、NoSQL数据库。
@ -27,7 +27,7 @@
- 关系 - 菱形框
- 重数 - 1:1一对一 / 1:N一对多 / M:N多对多
实际项目开发中,通常绘图的方式来辅助设计。在设计数据库时,我们可以利用数据库建模工具PowerDesigner绘制概念数据模型其本质就是ER模型然后再设置好目标数据库系统将概念模型转换成物理模型最终生成创建数据表的SQL
实际项目开发中我们可以利用数据库建模工具PowerDesigner绘制概念数据模型其本质就是ER模型然后再设置好目标数据库系统将概念模型转换成物理模型最终生成创建二维表的SQL很多工具都可以根据我们设计的物理模型图以及设定的目标数据库来导出SQL或直接生成数据表
![](./res/conceptual_model.png)
@ -40,9 +40,17 @@
### MySQL简介
1. 安装和配置以CentOS Linux环境为例
MySQL最早是由瑞典的MySQL AB公司开发的一个开放源码的关系数据库管理系统该公司于2008年被昇阳微系统公司Sun Microsystems收购。在2009年甲骨文公司Oracle收购昇阳微系统公司因此在这之后MySQL成为了Oracle旗下产品
- Linux下有一个MySQL的分支版本名为MariaDB它由MySQL的一些原始开发者开发有商业支持旨在继续保持MySQL数据库在[GNU GPL](https://zh.wikipedia.org/wiki/GNU%E9%80%9A%E7%94%A8%E5%85%AC%E5%85%B1%E8%AE%B8%E5%8F%AF%E8%AF%81)下开源因为大家担心MySQL被甲骨文收购后会不再开源。如果决定要直接使用MariaDB作为MySQL的替代品可以使用下面的命令进行安装。
MySQL在过去由于性能高、成本低、可靠性好已经成为最流行的开源数据库因此被广泛地应用于中小型网站开发。随着MySQL的不断成熟它也逐渐被应用于更多大规模网站和应用比如维基百科、谷歌Google、脸书Facebook、淘宝网等网站都使用了MySQL来提供数据持久化服务。
甲骨文公司收购后昇阳微系统公司大幅调涨MySQL商业版的售价且甲骨文公司不再支持另一个自由软件项目[OpenSolaris](https://zh.wikipedia.org/wiki/OpenSolaris)的发展因此导致自由软件社区对于Oracle是否还会持续支持MySQL社区版MySQL的各个发行版本中唯一免费的版本有所担忧MySQL的创始人麦克尔·维德纽斯以MySQL为基础成立分支计划[MariaDB](https://zh.wikipedia.org/wiki/MariaDB)以他女儿的名字命名的数据库。有许多原来使用MySQL数据库的公司例如维基百科已经陆续完成了从MySQL数据库到MariaDB数据库的迁移。
1. 安装和配置
> **说明**下面的安装和配置都是以CentOS Linux环境为例如果需要在其他系统下安装MySQL读者可以自行在网络上查找对应的安装教程
- 刚才说过MySQL有一个分支版本名叫MariaDB该数据库旨在继续保持MySQL数据库在[GNU GPL](https://zh.wikipedia.org/wiki/GNU%E9%80%9A%E7%94%A8%E5%85%AC%E5%85%B1%E8%AE%B8%E5%8F%AF%E8%AF%81)下开源。如果要使用MariaDB作为MySQL的替代品可以使用下面的命令进行安装。
```Shell
yum install mariadb mariadb-server
@ -76,6 +84,44 @@
rpm -qa | grep mysql
```
- 配置MySQL。
MySQL的配置文件在`/etc`目录下,名为`my.cnf`,默认的配置文件内容如下所示。如果对这个文件不理解并没有关系,什么时候用到这个配置文件什么时候再了解它就行了。
```Shell
cat /etc/my.cnf
```
```INI
# For advice on how to change settings please see
# http://dev.mysql.com/doc/refman/5.7/en/server-configuration-defaults.html
[mysqld]
#
# Remove leading # and set to the amount of RAM for the most important data
# cache in MySQL. Start at 70% of total RAM for dedicated server, else 10%.
# innodb_buffer_pool_size = 128M
#
# Remove leading # to turn on a very important data integrity option: logging
# changes to the binary log between backups.
# log_bin
#
# Remove leading # to set options mainly useful for reporting servers.
# The server defaults are faster for transactions and fast SELECTs.
# Adjust sizes as needed, experiment to find the optimal values.
# join_buffer_size = 128M
# sort_buffer_size = 2M
# read_rnd_buffer_size = 2M
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
```
- 启动MySQL服务。
可以使用下面的命令来启动MySQL。
@ -93,7 +139,7 @@
启动MySQL成功后可以通过下面的命令来检查网络端口使用情况MySQL默认使用3306端口。
```Shell
netstat -nap | grep mysql
netstat -ntlp | grep mysql
```
也可以使用下面的命令查找是否有名为mysqld的进程。
@ -128,7 +174,7 @@
alter user 'root'@'localhost' identified by '123456';
```
> 说明MySQL默认不允许使用弱口令作为用户口令所以我们通过上面的前两条命令修改了验证用户口令的策略和口令的长度。事实上我们不应该使用弱口令因为存在用户口令被暴力破解的风险。近年来攻击数据库窃取数据和劫持数据库勒索比特币的事件屡见不鲜要避免这些潜在的风险最为重要的一点是不要让数据库服务器暴露在公网上最好的做法是将数据库置于内网至少要做到不向公网开放数据库服务器的访问端口另外要保管好`root`账号的口令,应用系统需要访问数据库时,通常不使用`root`账号进行访问,而是创建其他拥有适当权限的账号来访问。
> 说明MySQL较新的版本默认不允许使用弱口令作为用户口令,所以我们通过上面的前两条命令修改了验证用户口令的策略和口令的长度。事实上我们不应该使用弱口令,因为存在用户口令被暴力破解的风险。近年来,攻击数据库窃取数据和劫持数据库勒索比特币的事件屡见不鲜,要避免这些潜在的风险,最为重要的一点是不要让数据库服务器暴露在公网上(最好的做法是将数据库置于内网,至少要做到不向公网开放数据库服务器的访问端口),另外要保管好`root`账号的口令,应用系统需要访问数据库时,通常不使用`root`账号进行访问,而是创建其他拥有适当权限的账号来访问。
再次使用客户端工具连接MySQL服务器时就可以使用新设置的口令了。在实际开发中为了方便用户操作可以选择图形化的客户端工具来连接MySQL服务器包括
@ -178,7 +224,11 @@
#### 基本操作
1. DDL
我们通常可以将SQL分为三类DDL数据定义语言、DML数据操作语言和DCL数据控制语言。DDL主要用于创建create、删除drop、修改alter数据库中的对象比如创建、删除和修改二维表DML主要负责插入数据insert、删除数据delete、更新数据update和查询selectDCL通常用于授予权限grant和召回权限revoke
> 说明SQL是不区分大小写的语言为了书写方便下面的SQL都使用了小写字母来书写。
1. DDL数据定义语言
```SQL
-- 如果存在名为school的数据库就删除它
@ -249,6 +299,251 @@
);
```
上面的DDL有几个地方需要强调一下
- 创建数据库时,我们通过`default charset utf8`指定了数据库默认使用的字符集我们推荐使用该字符集因为utf8能够支持国际化编码。如果将来数据库中用到的字符可能包括类似于Emoji这样的图片字符也可以将默认字符集设定为utf8mb4最大4字节的utf-8编码。查看MySQL支持的字符集可以执行下面的语句。
```SQL
show character set;
```
```
+----------+---------------------------------+---------------------+--------+
| Charset | Description | Default collation | Maxlen |
+----------+---------------------------------+---------------------+--------+
| big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
| dec8 | DEC West European | dec8_swedish_ci | 1 |
| cp850 | DOS West European | cp850_general_ci | 1 |
| hp8 | HP West European | hp8_english_ci | 1 |
| koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
| latin1 | cp1252 West European | latin1_swedish_ci | 1 |
| latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
| swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
| ascii | US ASCII | ascii_general_ci | 1 |
| ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
| sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
| hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 |
| tis620 | TIS620 Thai | tis620_thai_ci | 1 |
| euckr | EUC-KR Korean | euckr_korean_ci | 2 |
| koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
| gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
| greek | ISO 8859-7 Greek | greek_general_ci | 1 |
| cp1250 | Windows Central European | cp1250_general_ci | 1 |
| gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
| latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
| armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
| ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
| cp866 | DOS Russian | cp866_general_ci | 1 |
| keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
| macce | Mac Central European | macce_general_ci | 1 |
| macroman | Mac West European | macroman_general_ci | 1 |
| cp852 | DOS Central European | cp852_general_ci | 1 |
| latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
| cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
| utf16 | UTF-16 Unicode | utf16_general_ci | 4 |
| utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 |
| cp1256 | Windows Arabic | cp1256_general_ci | 1 |
| cp1257 | Windows Baltic | cp1257_general_ci | 1 |
| utf32 | UTF-32 Unicode | utf32_general_ci | 4 |
| binary | Binary pseudo charset | binary | 1 |
| geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
| cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
| eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
| gb18030 | China National Standard GB18030 | gb18030_chinese_ci | 4 |
+----------+---------------------------------+---------------------+--------+
41 rows in set (0.00 sec)
```
如果要设置MySQL服务启动时默认使用的字符集可以修改MySQL的配置并添加以下内容
```INI
[mysqld]
character-set-server=utf8
```
- 在创建表的时候,我们可以在右圆括号的后面通过`engine=XXX`来指定表的存储引擎MySQL支持多种存储引擎可以通过`show engines`命令进行查看。MySQL 5.5以后的版本默认使用的存储引擎是InnoDB它正好也就是我们推荐大家使用的存储引擎因为InnoDB更适合互联网应用对高并发、性能以及事务支持等方面的需求
```SQL
show engines\G
```
```
*************************** 1. row ***************************
Engine: InnoDB
Support: DEFAULT
Comment: Supports transactions, row-level locking, and foreign keys
Transactions: YES
XA: YES
Savepoints: YES
*************************** 2. row ***************************
Engine: MRG_MYISAM
Support: YES
Comment: Collection of identical MyISAM tables
Transactions: NO
XA: NO
Savepoints: NO
*************************** 3. row ***************************
Engine: MEMORY
Support: YES
Comment: Hash based, stored in memory, useful for temporary tables
Transactions: NO
XA: NO
Savepoints: NO
*************************** 4. row ***************************
Engine: BLACKHOLE
Support: YES
Comment: /dev/null storage engine (anything you write to it disappears)
Transactions: NO
XA: NO
Savepoints: NO
*************************** 5. row ***************************
Engine: MyISAM
Support: YES
Comment: MyISAM storage engine
Transactions: NO
XA: NO
Savepoints: NO
*************************** 6. row ***************************
Engine: CSV
Support: YES
Comment: CSV storage engine
Transactions: NO
XA: NO
Savepoints: NO
*************************** 7. row ***************************
Engine: ARCHIVE
Support: YES
Comment: Archive storage engine
Transactions: NO
XA: NO
Savepoints: NO
*************************** 8. row ***************************
Engine: PERFORMANCE_SCHEMA
Support: YES
Comment: Performance Schema
Transactions: NO
XA: NO
Savepoints: NO
*************************** 9. row ***************************
Engine: FEDERATED
Support: NO
Comment: Federated MySQL storage engine
Transactions: NULL
XA: NULL
Savepoints: NULL
9 rows in set (0.00 sec)
```
下面的表格对MySQL几种常用的数据引擎进行了简单的对比。
| 特性 | InnoDB | MRG_MYISAM | MEMORY | MyISAM |
| ------------ | ------------ | ---------- | ------ | ------ |
| 存储限制 | 有 | 没有 | 有 | 有 |
| 事务 | 支持 | | | |
| 锁机制 | 行锁 | 表锁 | 表锁 | 表锁 |
| B树索引 | 支持 | 支持 | 支持 | 支持 |
| 哈希索引 | | | 支持 | |
| 全文检索 | 支持5.6+ | | | 支持 |
| 集群索引 | 支持 | | | |
| 数据缓存 | 支持 | | 支持 | |
| 索引缓存 | 支持 | 支持 | 支持 | 支持 |
| 数据可压缩 | | | | 支持 |
| 内存使用 | 高 | 低 | 中 | 低 |
| 存储空间使用 | 高 | 低 | | 低 |
| 批量插入性能 | 低 | 高 | 高 | 高 |
| 是否支持外键 | 支持 | | | |
通过上面的比较我们可以了解到InnoDB是唯一能够支持外键、事务以及行锁的存储引擎所以我们之前说它更适合互联网应用而且它也是较新的MySQL版本中默认使用的存储引擎。
- 在定义表结构为每个字段选择数据类型时如果不清楚哪个数据类型更合适可以通过MySQL的帮助系统来了解每种数据类型的特性、数据的长度和精度等相关信息。
```SQL
? data types
```
```
You asked for help about help category: "Data Types"
For more information, type 'help <item>', where <item> is one of the following
topics:
AUTO_INCREMENT
BIGINT
BINARY
BIT
BLOB
BLOB DATA TYPE
BOOLEAN
CHAR
CHAR BYTE
DATE
DATETIME
DEC
DECIMAL
DOUBLE
DOUBLE PRECISION
ENUM
FLOAT
INT
INTEGER
LONGBLOB
LONGTEXT
MEDIUMBLOB
MEDIUMINT
MEDIUMTEXT
SET DATA TYPE
SMALLINT
TEXT
TIME
TIMESTAMP
TINYBLOB
TINYINT
TINYTEXT
VARBINARY
VARCHAR
YEAR DATA TYPE
```
```SQL
? varchar
```
```
Name: 'VARCHAR'
Description:
[NATIONAL] VARCHAR(M) [CHARACTER SET charset_name] [COLLATE
collation_name]
A variable-length string. M represents the maximum column length in
characters. The range of M is 0 to 65,535. The effective maximum length
of a VARCHAR is subject to the maximum row size (65,535 bytes, which is
shared among all columns) and the character set used. For example, utf8
characters can require up to three bytes per character, so a VARCHAR
column that uses the utf8 character set can be declared to be a maximum
of 21,844 characters. See
http://dev.mysql.com/doc/refman/5.7/en/column-count-limit.html.
MySQL stores VARCHAR values as a 1-byte or 2-byte length prefix plus
data. The length prefix indicates the number of bytes in the value. A
VARCHAR column uses one length byte if values require no more than 255
bytes, two length bytes if values may require more than 255 bytes.
*Note*:
MySQL follows the standard SQL specification, and does not remove
trailing spaces from VARCHAR values.
VARCHAR is shorthand for CHARACTER VARYING. NATIONAL VARCHAR is the
standard SQL way to define that a VARCHAR column should use some
predefined character set. MySQL uses utf8 as this predefined character
set. http://dev.mysql.com/doc/refman/5.7/en/charset-national.html.
NVARCHAR is shorthand for NATIONAL VARCHAR.
URL: http://dev.mysql.com/doc/refman/5.7/en/string-type-overview.html
```
在数据类型的选择上保存字符串数据通常都使用VARCHAR和CHAR两种类型前者通常称为变长字符串而后者通常称为定长字符串对于InnoDB存储引擎行存储格式没有区分固定长度和可变长度列因此VARCHAR类型好CHAR类型没有本质区别后者不一定比前者性能更好。如果要保存的很大字符串可以使用TEXT类型如果要保存很大的字节串可以使用BLOB二进制大对象类型。在MySQL中TEXT和BLOB又分别包括TEXT、MEDIUMTEXT、LONGTEXT和BLOB、MEDIUMBLOB、LONGBLOB三种不同的类型它们主要的区别在于存储数据的最大大小不同。保存浮点数可以用FLOAT或DOUBLE类型而保存定点数应该使用DECIMAL类型。如果要保存时间日期DATETIME类型优于TIMESTAMP类型因为前者能表示的时间日期范围更大。
2. DML
```SQL
@ -320,8 +615,6 @@
(3755, 9999, '2017-09-01', 92);
```
3. DQL
```SQL
-- 查询所有学生信息
select * from tb_student;
@ -416,10 +709,89 @@
select stuname, ifnull(total, 0) from tb_student left outer join ( select sid, count(sid) as total from tb_record group by sid ) temp on stuid=sid;
```
4. DCL
上面的DML有几个地方需要加以说明
1. MySQL中支持多种类型的运算符包括算术运算符+、-、*、/、%)、比较运算符(=、<>、<=>、<<=、>、>=、BETWEEN...AND...、IN、IS NULL、IS NOT NULL、LIKE、RLIKE、REGEXP、逻辑运算符NOT、AND、OR、XOR和位运算符&、|、^、~、>>、<<我们可以在DML中使用这些运算符处理数据。
2. 在查询数据时可以在SELECT语句及其子句如WHERE子句、ORDER BY子句、HAVING子句等中使用函数这些函数包括字符串函数、数值函数、时间日期函数、流程函数等如下面的表格所示。
常用字符串函数。
| 函数 | 功能 |
| ----------------------- | ----------------------------------------------------- |
| CONCAT | 将多个字符串连接成一个字符串 |
| FORMAT | 将数值格式化成字符串并指定保留几位小数 |
| FROM_BASE64 / TO_BASE64 | BASE64解码/编码 |
| BIN / OCT / HEX | 将数值转换成二进制/八进制/十六进制字符串 |
| LOCATE | 在字符串中查找一个子串的位置 |
| LEFT / RIGHT | 返回一个字符串左边/右边指定长度的字符 |
| LENGTH / CHAR_LENGTH | 返回字符串的长度以字节/字符为单位 |
| LOWER / UPPER | 返回字符串的小写/大写形式 |
| LPAD / RPAD | 如果字符串的长度不足,在字符串左边/右边填充指定的字符 |
| LTRIM / RTRIM | 去掉字符串前面/后面的空格 |
| ORD / CHAR | 返回字符对应的编码/返回编码对应的字符 |
| STRCMP | 比较字符串,返回-1、0、1分别表示小于、等于、大于 |
| SUBSTRING | 返回字符串指定范围的子串 |
常用数值函数。
| 函数 | 功能 |
| ------------------------------------------ | ---------------------------------- |
| ABS | 返回一个数的绝度值 |
| CEILING / FLOOR | 返回一个数上取整/下取整的结果 |
| CONV | 将一个数从一种进制转换成另一种进制 |
| CRC32 | 计算循环冗余校验码 |
| EXP / LOG / LOG2 / LOG10 | 计算指数/对数 |
| POW | 求幂 |
| RAND | 返回[0,1)范围的随机数 |
| ROUND | 返回一个数四舍五入后的结果 |
| SQRT | 返回一个数的平方根 |
| TRUNCATE | 截断一个数到指定的精度 |
| SIN / COS / TAN / COT / ASIN / ACOS / ATAN | 三角函数 |
常用时间日期函数。
| 函数 | 功能 |
| ----------------------- | ------------------------------------- |
| CURDATE / CURTIME / NOW | 获取当前日期/时间/日期和时间 |
| ADDDATE / SUBDATE | 将两个日期表达式相加/相减并返回结果 |
| DATE / TIME | 从字符串中获取日期/时间 |
| YEAR / MONTH / DAY | 从日期中获取年/月/日 |
| HOUR / MINUTE / SECOND | 从时间中获取时/分/秒 |
| DATEDIFF / TIMEDIFF | 返回两个时间日期表达式相差多少天/小时 |
| MAKEDATE / MAKETIME | 制造一个日期/时间 |
常用流程函数。
| 函数 | 功能 |
| ------ | ------------------------------------------------ |
| IF | 根据条件是否成立返回不同的值 |
| IFNULL | 如果为NULL则返回指定的值否则就返回本身 |
| NULLIF | 两个表达式相等就返回NULL否则返回第一个表达式的值 |
其他常用函数。
| 函数 | 功能 |
| ---------------------- | ----------------------------- |
| MD5 / SHA1 / SHA2 | 返回字符串对应的哈希摘要 |
| CHARSET / COLLATION | 返回字符集/校对规则 |
| USER / CURRENT_USER | 返回当前用户 |
| DATABASE | 返回当前数据库名 |
| VERSION | 返回当前数据库版本 |
| FOUND_ROWS / ROW_COUNT | 返回查询到的行数/受影响的行数 |
| LAST_INSERT_ID | 返回最后一个自增主键的值 |
| UUID / UUID_SHORT | 返回全局唯一标识符 |
3. DCL
```SQL
-- 创建名为hellokitty的用户
-- 创建可以远程登录的root账号并为其指定口令
create user 'root'@'%' identified by '123456';
-- 为远程登录的root账号授权操作所有数据库所有对象的所有权限并允许其将权限再次赋予其他用户
grant all privileges on *.* to 'root'@'%' with grant option;
-- 创建名为hellokitty的用户并为其指定口令
create user 'hellokitty'@'%' identified by '123123';
-- 将对school数据库所有对象的所有操作权限授予hellokitty
@ -429,6 +801,127 @@
revoke insert, delete, update on school.* from 'hellokitty'@'%';
```
> 说明:创建一个可以允许任意主机登录并且具有超级管理员权限的用户在现实中并不是一个明智的决定,因为一旦该账号的口令泄露或者被破解,数据库将会面临灾难级的风险。
#### 索引
索引是关系型数据库中用来提升查询性能最为重要的手段。关系型数据库中的索引就像一本书的目录,我们可以想象一下,如果要从一本书中找出某个知识点,但是这本书没有目录,这将是意见多么可怕的事情(我们估计得一篇一篇的翻下去,才能确定这个知识点到底在什么位置)。创建索引虽然会带来存储空间上的开销,就像一本书的目录会占用一部分的篇幅一样,但是在牺牲空间后换来的查询时间的减少也是非常显著的。
MySQL中所有数据类型的列都可以被索引常用的存储引擎InnoDB和MyISAM能支持每个表创建16个索引。InnoDB和MyISAM使用的索引其底层算法是B-treeB树B-tree是一种自平衡的树类似于平衡二叉排序树能够保持数据有序。这种数据结构能够让查找数据、顺序访问、插入数据及删除的操作都在对数时间内完成。
接下来我们通过一个简单的例子来说明索引的意义比如我们要根据学生的姓名来查找学生这个场景在实际开发中应该经常遇到就跟通过商品名称查找商品道理是一样的。我们可以使用MySQL的`explain`关键字来查看SQL的执行计划。
```SQL
explain select * from tb_student where stuname='林震南'\G
```
```
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: tb_student
partitions: NULL
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 11
filtered: 10.00
Extra: Using where
1 row in set, 1 warning (0.00 sec)
```
在上面的SQL执行计划中有几项值得我们关注
1. typeMySQL在表中找到满足条件的行的方式也称为访问类型包括ALL全表扫描、index索引全扫描、range索引范围扫描、ref非唯一索引扫描、eq_ref唯一索引扫描、const/system、NULL。在所有的访问类型中很显然ALL是性能最差的它代表了全表扫描是指要扫描表中的每一行才能找到匹配的行。
2. possible_keysMySQL可以选择的索引但是**有可能不会使用**。
3. keyMySQL真正使用的索引。
4. rows执行查询需要扫描的行数这是一个**预估值**。
从上面的执行计划可以看出,当我们通过学生名字查询学生时实际上是进行了全表扫描,不言而喻这个查询性能肯定是非常糟糕的,尤其是在表中的行很多的时候。如果我们需要经常通过学生姓名来查询学生,那么就应该在学生姓名对应的列上创建索引,通过索引来加速查询。
```SQL
create index idx_student_name on tb_student(stuname);
```
再次查看刚才的SQL对应的执行计划。
```SQL
explain select * from tb_student where stuname='林震南'\G
```
```
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: tb_student
partitions: NULL
type: ref
possible_keys: idx_student_name
key: idx_student_name
key_len: 62
ref: const
rows: 1
filtered: 100.00
Extra: NULL
1 row in set, 1 warning (0.00 sec)
```
可以注意到在对学生姓名创建索引后刚才的查询已经不是全表扫描而是基于索引的查询而且扫描的行只有唯一的一行这显然大大的提升了查询的性能。MySQL中还允许创建前缀索引即对索引字段的前N个字符创建索引这样的话可以减少索引占用的空间但节省了空间很有可能会浪费时间**时间和空间是不可调和的矛盾**),如下所示。
```SQL
create index idx_student_name_1 on tb_student(stuname(1));
```
上面的索引相当于是根据学生姓名的第一个字来创建的索引我们再看看SQL执行计划。
```SQL
explain select * from tb_student where stuname='林震南'\G
```
```
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: tb_student
partitions: NULL
type: ref
possible_keys: idx_student_name
key: idx_student_name
key_len: 5
ref: const
rows: 2
filtered: 100.00
Extra: Using where
1 row in set, 1 warning (0.00 sec)
```
不知道大家是否注意到这一次扫描的行变成了2行因为学生表中有两个姓“林”的学生我们只用姓名的第一个字作为索引的话在查询时通过索引就会找到这两行。
如果要删除索引可以使用下面的SQL。
```SQL
alter table tb_student drop index idx_student_name;
```
或者
```SQL
drop index idx_student_name on tb_student;
```
我们简单的为大家总结一下索引的设计原则:
1. **最适合**索引的列是出现在**WHERE子句**和连接子句中的列。
2. 索引列的基数越大(取值多重复值少),索引的效果就越好。
3. 使用**前缀索引**可以减少索引占用的空间,内存中可以缓存更多的索引。
4. **索引不是越多越好**,虽然索引加速了读操作(查询),但是写操作(增、删、改)都会变得更慢,因为数据的变化会导致索引的更新,就如同书籍章节的增删需要更新目录一样。
5. 使用InnoDB存储引擎时表的普通索引都会保存主键的值所以**主键要尽可能选择较短的数据类型**,这样可以有效的减少索引占用的空间,利用提升索引的缓存效果。
最后还有一点需要说明InnoDB使用的B-tree索引数值类型的列除了等值判断时索引会生效之外使用>、<、>=、<=、BETWEEN...AND... 、<>时,索引仍然生效;对于字符串类型的列,如果使用不以通配符开头的模糊查询,索引也是起作用的,但是其他的情况会导致索引失效,这就意味着很有可能会做全表查询。
#### 视图
视图是关系型数据库中将一组查询指令构成的结果集组合成可查询的数据表的对象。简单的说视图就是虚拟的表但与数据表不同的是数据表是一种实体结构而视图是一种虚拟结构你也可以将视图理解为保存在数据库中被赋予名字的SQL语句。
@ -443,12 +936,14 @@
创建视图。
```SQL
create view vw_avg_score
create view vw_score
as
select sid, round(avg(score), 1) as avgscore from tb_record group by sid;
create view vw_student_score
as
select stuname, avgscore
from
tb_student t1,
(select sid, round(avg(score), 1) as avgscore from tb_record group by sid) t2
from tb_student, vw_score
where stuid=sid;
```
@ -457,7 +952,7 @@ as
使用视图。
```SQL
select stuname, avgscore from vw_avg_score order by avgscore desc;
select stuname, avgscore from vw_student_score order by avgscore desc;
```
```
@ -474,10 +969,17 @@ select stuname, avgscore from vw_avg_score order by avgscore desc;
+--------------+----------+
```
既然视图是一张虚拟的表,那么视图的中的数据可以更新吗?视图的可更新性要视具体情况而定,以下类型的视图是不能更新的:
1. 使用了聚合函数SUM、MIN、MAX、AVG、COUNT等、DISTINCT、GROUP BY、HAVING、UNION或者UNION ALL的视图。
2. SELECT中包含了子查询的视图。
3. FROM子句中包含了一个不能更新的视图的视图。
4. WHERE子句的子查询引用了FROM子句中的表的视图。
删除视图。
```SQL
drop view vw_avg_score;
drop view vw_student_score;
```
> **说明**:如果希望更新视图,可以先用上面的命令删除视图,也可以通过`create or replace view`来更新视图。
@ -490,14 +992,14 @@ drop view vw_avg_score;
#### 存储过程
迄今为止,我们使用的大多数SQL语句都是针对一个或多个表的单条语句但在实际开发中经常会遇到某个操作需要多条SQL语句才能完成的情况。例如电商网站在受理用户订单时需要做以下一系列的处理。
存储过程是事先编译好存储在数据库中的一组SQL的集合调用存储过程可以简化应用程序开发人员的工作减少与数据库服务器之间的通信对于提升数据操作的性能也是有帮助的。其实迄今为止我们使用的SQL语句都是针对一个或多个表的单条语句但在实际开发中经常会遇到某个操作需要多条SQL语句才能完成的情况。例如电商网站在受理用户订单时需要做以下一系列的处理。
1. 通过查询来核对库存中是否有对应的物品以及库存是否充足。
2. 如果库存有物品,需要锁定库存以确保这些物品不再卖给别人, 并且要减少可用的物品数量以反映正确的库存量。
3. 如果库存不足,可能需要进一步与供应商进行交互或者至少产生一条系统提示消息。
4. 不管受理订单是否成功,都需要产生流水记录,而且需要通知对应的用户
4. 不管受理订单是否成功,都需要产生流水记录,而且需要给对应的用户产生一条通知信息
我们可以通过创建存储过程来解决这些问题。简单的说存储过程就是为以后的使用而保存的一条或多条MySQL语句的集合。通过存储过程可以将复杂的操作封装起来而且有助于保证数据的一致性如果将来业务发生了变动只需要调整修改存储过程即可。对于调用存储过程的用户来说,存储过程并没有暴露数据表的细节,而且执行存储过程比执行单独的SQL要快
我们可以通过存储过程将复杂的操作封装起来,这样不仅有助于保证数据的一致性,而且将来如果业务发生了变动,只需要调整和修改存储过程即可。对于调用存储过程的用户来说,存储过程并没有暴露数据表的细节,而且执行存储过程比一条条的执行一组SQL要快得多
下面的存储过程实现了查询某门课程的最高分、最低分和平均分。
@ -517,7 +1019,7 @@ end $$
delimiter ;
```
> 说明在定义存储过程时因为可能需要书写多条SQL而分隔这些SQL需要使用分号作为分隔符如果这个时候仍然用分号表示整段代码结束需要执行这段代码,那么定义存储过程的SQL就会出现错误所以上面我们用`delimiter $$`将整段代码结束的标记定义为`$$`,那么代码中的分号将不再表示整段代码的结束,直到遇到`end $$`整段代码才输入完成。定义完存储过程后,我们又将通过`delimiter ;`将结束符改回成分号。
> 说明在定义存储过程时因为可能需要书写多条SQL而分隔这些SQL需要使用分号作为分隔符如果这个时候仍然用分号表示整段代码结束那么定义存储过程的SQL就会出现错误所以上面我们用`delimiter $$`将整段代码结束的标记定义为`$$`,那么代码中的分号将不再表示整段代码的结束,需要马上执行,整段代码在遇到`end $$`时才输入完成并执行。在定义完存储过程后,通过`delimiter ;`将结束符重新改回成分号。
上面定义的存储过程有四个参数,其中第一个参数是输入参数,代表课程的编号,后面的参数都是输出参数,因为存储过程不能定义返回值,只能通过输出参数将执行结果带出,定义输出参数的关键字是`out`,默认情况下参数都是输入参数。
@ -539,7 +1041,9 @@ select @a as 最高分, @b as 最低分, @c as 平均分;
drop procedure sp_get_score;
```
### 相关知识
在存储过程中我们可以定义变量、条件可以使用分支和循环语句可以通过游标操作查询结果还可以使用事件调度器这些内容我们暂时不在此处进行介绍。虽然我们说了很多存储过程的好处但是在实际开发中如果过度的使用存储过程将大量复杂的运算放到存储过程中也会导致占用数据库服务器的CPU资源造成数据库服务器承受巨大的压力。为此我们一般会将复杂的运算和处理交给应用服务器因为很容易部署多台应用服务器来分摊这些压力。
### 几个重要的概念
#### 范式理论 - 设计二维表的指导思想
@ -568,7 +1072,7 @@ drop procedure sp_get_score;
#### 数据一致性
1. 事务:一系列对数据库进行读/写的操作。
1. 事务:一系列对数据库进行读/写的操作,这些操作要么全都成功,要么全都失败
2. 事务的ACID特性
- 原子性:事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行
@ -584,6 +1088,12 @@ drop procedure sp_get_score;
start transaction
```
```SQL
begin
```
- 提交事务
```SQL
@ -596,6 +1106,10 @@ drop procedure sp_get_score;
rollback
```
### 其他内容
大家应该能够想到关于MySQL的知识肯定远远不止上面列出的这些比如MySQL的性能优化、管理和维护MySQL的相关工具、MySQL数据的备份和恢复、监控MySQL、部署高可用架构等问题我们在这里都没有进行讨论。当然这些内容也都是跟项目开发密切相关的我们就留到后续的章节中再续点进行讲解。
### Python数据库编程
我们用如下所示的数据库来演示在Python中如何访问MySQL数据库。
@ -654,7 +1168,7 @@ insert into tb_emp values
(3588, '朱九真', '会计', 5566, 2500, null, 10);
```
在Python 3中我们通常使用纯Python的三方库PyMySQL来访问MySQL数据库它应该是目前最好的选择。
在Python 3中我们通常使用纯Python的三方库PyMySQL来访问MySQL数据库它应该是目前Python操作MySQL数据库最好的选择。
1. 安装PyMySQL。
@ -725,6 +1239,8 @@ insert into tb_emp values
main()
```
> 说明如果不希望每次SQL操作之后手动提交或回滚事务可以像上面的代码那样在创建连接的时候多加一个名为`autocommit`的参数并将它的值设置为`True`表示每次执行SQL之后自动提交。如果程序中不需要使用事务环境也不希望手动的提交或回滚就可以这么做。
4. 更新一个部门。
```Python