diff --git a/Day01-15/01.初识Python.md b/Day01-15/01.初识Python.md index e186895..366e71f 100755 --- a/Day01-15/01.初识Python.md +++ b/Day01-15/01.初识Python.md @@ -1,5 +1,7 @@ ## 初识Python +> **温馨提示**:2018年创建这个仓库的时候,关于Python语言基础这个部分的内容写得相对是比较粗糙,对粗学者可能不是那么友好。如果你正好是一名初学者,建议你移步到我的另一个仓库[Python-for-Freshmen-2023](https://github.com/jackfrued/Python-for-Freshmen-2023),这个仓库对初学者更加友好,对应的内容,大家也可以在我的知乎专栏“从零开始学Python”中找到,点击进入[传送门](https://www.zhihu.com/column/c_1216656665569013760)。 + ### Python简介 #### Python的历史 diff --git a/Day36-40/37.SQL详解.md b/Day36-40/37.SQL详解.md deleted file mode 100755 index 39766a7..0000000 --- a/Day36-40/37.SQL详解.md +++ /dev/null @@ -1,1468 +0,0 @@ -## SQL 和 MySQL 详解 - -### SQL 详解 - -我们通常可以将 SQL 分为四类,分别是 DDL(数据定义语言)、DML(数据操作语言)、DQL(数据查询语言)和 DCL(数据控制语言)。DDL 主要用于创建、删除、修改数据库中的对象,比如创建、删除和修改二维表,核心的关键字包括`create`、`drop`和`alter`;DML 主要负责数据的插入、删除和更新,关键词包括`insert`、`delete`和`update`;DQL 负责数据查询,最重要的一个关键词是`select`;DCL 通常用于授予和召回权限,核心关键词是`grant`和`revoke`。 - -> **说明**:SQL 是不区分大小写的语言,为了书写和识别方便,下面的 SQL 都使用了小写字母来书写。 - -#### DDL(数据定义语言) - -下面我们来实现一个选课系统的数据库,如下所示的 SQL 创建了名为`school`的数据库和五张表,分别是学院表(`tb_college`)、学生表(`tb_student`)、教师表(`tb_teacher`)、课程表(`tb_course`)和选课记录表(`tb_record`),其中学生和教师跟学院之间是多对一关系,课程跟老师之间也是多对一关系,学生和课程是多对多关系,选课记录表就是维持学生跟课程多对多关系的中间表。 - -```SQL --- 如果存在名为school的数据库就删除它 -drop database if exists `school`; - --- 创建名为school的数据库并设置默认的字符集和排序方式 -create database `school` default character set utf8mb4 collate utf8mb4_general_ci; - --- 切换到school数据库上下文环境 -use `school`; - --- 创建学院表 -create table `tb_college` -( -`col_id` int unsigned auto_increment comment '编号', -`col_name` varchar(50) not null comment '名称', -`col_intro` varchar(500) default '' comment '介绍', -primary key (`col_id`) -) engine=innodb auto_increment=1 comment '学院表'; - --- 创建学生表 -create table `tb_student` -( -`stu_id` int unsigned not null comment '学号', -`stu_name` varchar(20) not null comment '姓名', -`stu_sex` boolean default 1 not null comment '性别', -`stu_birth` date not null comment '出生日期', -`stu_addr` varchar(255) default '' comment '籍贯', -`col_id` int unsigned not null comment '所属学院', -primary key (`stu_id`), -constraint `fk_student_col_id` foreign key (`col_id`) references `tb_college` (`col_id`) -) engine=innodb comment '学生表'; - --- 创建教师表 -create table `tb_teacher` -( -`tea_id` int unsigned not null comment '工号', -`tea_name` varchar(20) not null comment '姓名', -`tea_title` varchar(10) default '助教' comment '职称', -`col_id` int unsigned not null comment '所属学院', -primary key (`tea_id`), -constraint `fk_teacher_col_id` foreign key (`col_id`) references `tb_college` (`col_id`) -) engine=innodb comment '老师表'; - --- 创建课程表 -create table `tb_course` -( -`cou_id` int unsigned not null comment '编号', -`cou_name` varchar(50) not null comment '名称', -`cou_credit` int not null comment '学分', -`tea_id` int unsigned not null comment '授课老师', -primary key (`cou_id`), -constraint `fk_course_tea_id` foreign key (`tea_id`) references `tb_teacher` (`tea_id`) -) engine=innodb comment '课程表'; - --- 创建选课记录表 -create table `tb_record` -( -`rec_id` bigint unsigned auto_increment comment '选课记录号', -`stu_id` int unsigned not null comment '学号', -`cou_id` int unsigned not null comment '课程编号', -`sel_date` date not null comment '选课日期', -`score` decimal(4,1) comment '考试成绩', -primary key (`rec_id`), -constraint `fk_record_stu_id` foreign key (`stu_id`) references `tb_student` (`stu_id`), -constraint `fk_record_cou_id` foreign key (`cou_id`) references `tb_course` (`cou_id`), -constraint `uk_record_stu_cou` unique (`stu_id`, `cou_id`) -) engine=innodb comment '选课记录表'; -``` - -上面的DDL有几个地方需要强调一下: - -- 创建数据库时,我们通过`default character set utf8mb4`指定了数据库默认使用的字符集为`utf8mb4`(最大`4`字节的`utf-8`编码),我们推荐使用该字符集,它也是 MySQL 8.x 默认使用的字符集,因为它能够支持国际化编码,还可以存储 Emoji 字符。可以通过下面的命令查看 MySQL 支持的字符集以及默认的排序规则。 - - ```SQL - show character set; - ``` - - ``` - +----------+---------------------------------+---------------------+--------+ - | Charset | Description | Default collation | Maxlen | - +----------+---------------------------------+---------------------+--------+ - | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | - | dec8 | DEC West European | dec8_swedish_ci | 1 | - | cp850 | DOS West European | cp850_general_ci | 1 | - | hp8 | HP West European | hp8_english_ci | 1 | - | koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 | - | latin1 | cp1252 West European | latin1_swedish_ci | 1 | - | latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 | - | swe7 | 7bit Swedish | swe7_swedish_ci | 1 | - | ascii | US ASCII | ascii_general_ci | 1 | - | ujis | EUC-JP Japanese | ujis_japanese_ci | 3 | - | sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 | - | hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 | - | tis620 | TIS620 Thai | tis620_thai_ci | 1 | - | euckr | EUC-KR Korean | euckr_korean_ci | 2 | - | koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 | - | gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 | - | greek | ISO 8859-7 Greek | greek_general_ci | 1 | - | cp1250 | Windows Central European | cp1250_general_ci | 1 | - | gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 | - | latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 | - | armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 | - | utf8 | UTF-8 Unicode | utf8_general_ci | 3 | - | ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 | - | cp866 | DOS Russian | cp866_general_ci | 1 | - | keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 | - | macce | Mac Central European | macce_general_ci | 1 | - | macroman | Mac West European | macroman_general_ci | 1 | - | cp852 | DOS Central European | cp852_general_ci | 1 | - | latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 | - | utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 | - | cp1251 | Windows Cyrillic | cp1251_general_ci | 1 | - | utf16 | UTF-16 Unicode | utf16_general_ci | 4 | - | utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 | - | cp1256 | Windows Arabic | cp1256_general_ci | 1 | - | cp1257 | Windows Baltic | cp1257_general_ci | 1 | - | utf32 | UTF-32 Unicode | utf32_general_ci | 4 | - | binary | Binary pseudo charset | binary | 1 | - | geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 | - | cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 | - | eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 | - | gb18030 | China National Standard GB18030 | gb18030_chinese_ci | 4 | - +----------+---------------------------------+---------------------+--------+ - 41 rows in set (0.00 sec) - ``` - - 如果要设置 MySQL 服务启动时默认使用的字符集,可以修改MySQL的配置并添加以下内容。 - - ```INI - [mysqld] - character-set-server=utf8 - ``` - -- 在创建表的时候,可以自行选择底层的存储引擎。MySQL 支持多种存储引擎,可以通过`show engines`命令进行查看。MySQL 5.5 以后的版本默认使用的存储引擎是 InnoDB,它是我们推荐大家使用的存储引擎(因为更适合当下互联网应用对高并发、性能以及事务支持等方面的需求),为了 SQL 语句的向下兼容性,我们可以在建表语句结束处右圆括号的后面通过`engine=innodb`来指定使用 InnoDB 存储引擎。 - - ```SQL - show engines\G - ``` - - ``` - *************************** 1. row *************************** - Engine: InnoDB - Support: DEFAULT - Comment: Supports transactions, row-level locking, and foreign keys - Transactions: YES - XA: YES - Savepoints: YES - *************************** 2. row *************************** - Engine: MRG_MYISAM - Support: YES - Comment: Collection of identical MyISAM tables - Transactions: NO - XA: NO - Savepoints: NO - *************************** 3. row *************************** - Engine: MEMORY - Support: YES - Comment: Hash based, stored in memory, useful for temporary tables - Transactions: NO - XA: NO - Savepoints: NO - *************************** 4. row *************************** - Engine: BLACKHOLE - Support: YES - Comment: /dev/null storage engine (anything you write to it disappears) - Transactions: NO - XA: NO - Savepoints: NO - *************************** 5. row *************************** - Engine: MyISAM - Support: YES - Comment: MyISAM storage engine - Transactions: NO - XA: NO - Savepoints: NO - *************************** 6. row *************************** - Engine: CSV - Support: YES - Comment: CSV storage engine - Transactions: NO - XA: NO - Savepoints: NO - *************************** 7. row *************************** - Engine: ARCHIVE - Support: YES - Comment: Archive storage engine - Transactions: NO - XA: NO - Savepoints: NO - *************************** 8. row *************************** - Engine: PERFORMANCE_SCHEMA - Support: YES - Comment: Performance Schema - Transactions: NO - XA: NO - Savepoints: NO - *************************** 9. row *************************** - Engine: FEDERATED - Support: NO - Comment: Federated MySQL storage engine - Transactions: NULL - XA: NULL - Savepoints: NULL - 9 rows in set (0.00 sec) - ``` - - 下面的表格对MySQL几种常用的数据引擎进行了简单的对比。 - - | 特性 | InnoDB | MRG_MYISAM | MEMORY | MyISAM | - | ------------ | ------------ | ---------- | ------ | ------ | - | 存储限制 | 有 | 没有 | 有 | 有 | - | 事务 | 支持 | | | | - | 锁机制 | 行锁 | 表锁 | 表锁 | 表锁 | - | B树索引 | 支持 | 支持 | 支持 | 支持 | - | 哈希索引 | | | 支持 | | - | 全文检索 | 支持(5.6+) | | | 支持 | - | 集群索引 | 支持 | | | | - | 数据缓存 | 支持 | | 支持 | | - | 索引缓存 | 支持 | 支持 | 支持 | 支持 | - | 数据可压缩 | | | | 支持 | - | 内存使用 | 高 | 低 | 中 | 低 | - | 存储空间使用 | 高 | 低 | | 低 | - | 批量插入性能 | 低 | 高 | 高 | 高 | - | 是否支持外键 | 支持 | | | | - - 通过上面的比较我们可以了解到,InnoDB 是唯一能够支持外键、事务以及行锁的存储引擎,所以我们之前说它更适合互联网应用,而且在较新版本的 MySQL 中,它也是默认使用的存储引擎。 - -- 在定义表结构为每个字段选择数据类型时,如果不清楚哪个数据类型更合适,可以通过 MySQL 的帮助系统来了解每种数据类型的特性、数据的长度和精度等相关信息。 - - ```SQL - ? data types - ``` - - ``` - You asked for help about help category: "Data Types" - For more information, type 'help ', where is one of the following - topics: - AUTO_INCREMENT - BIGINT - BINARY - BIT - BLOB - BLOB DATA TYPE - BOOLEAN - CHAR - CHAR BYTE - DATE - DATETIME - DEC - DECIMAL - DOUBLE - DOUBLE PRECISION - ENUM - FLOAT - INT - INTEGER - LONGBLOB - LONGTEXT - MEDIUMBLOB - MEDIUMINT - MEDIUMTEXT - SET DATA TYPE - SMALLINT - TEXT - TIME - TIMESTAMP - TINYBLOB - TINYINT - TINYTEXT - VARBINARY - VARCHAR - YEAR DATA TYPE - ``` - - ```SQL - ? varchar - ``` - - ``` - Name: 'VARCHAR' - Description: - [NATIONAL] VARCHAR(M) [CHARACTER SET charset_name] [COLLATE - collation_name] - - A variable-length string. M represents the maximum column length in - characters. The range of M is 0 to 65,535. The effective maximum length - of a VARCHAR is subject to the maximum row size (65,535 bytes, which is - shared among all columns) and the character set used. For example, utf8 - characters can require up to three bytes per character, so a VARCHAR - column that uses the utf8 character set can be declared to be a maximum - of 21,844 characters. See - http://dev.mysql.com/doc/refman/5.7/en/column-count-limit.html. - - MySQL stores VARCHAR values as a 1-byte or 2-byte length prefix plus - data. The length prefix indicates the number of bytes in the value. A - VARCHAR column uses one length byte if values require no more than 255 - bytes, two length bytes if values may require more than 255 bytes. - - *Note*: - - MySQL follows the standard SQL specification, and does not remove - trailing spaces from VARCHAR values. - - VARCHAR is shorthand for CHARACTER VARYING. NATIONAL VARCHAR is the - standard SQL way to define that a VARCHAR column should use some - predefined character set. MySQL uses utf8 as this predefined character - set. http://dev.mysql.com/doc/refman/5.7/en/charset-national.html. - NVARCHAR is shorthand for NATIONAL VARCHAR. - - URL: http://dev.mysql.com/doc/refman/5.7/en/string-type-overview.html - ``` - - 在数据类型的选择上,保存字符串数据通常都使用`VARCHAR`和`CHAR`两种类型,前者通常称为变长字符串,而后者通常称为定长字符串;对于 InnoDB 存储引擎,行存储格式没有区分固定长度和可变长度列,因此`VARCHAR`类型和`CHAR`类型没有本质区别,后者不一定比前者性能更好。如果要保存的很大字符串,可以使用`TEXT`类型;如果要保存很大的字节串,可以使用`BLOB`(二进制大对象)类型。在 MySQL 中,`TEXT`和`BLOB`又分别包括`TEXT`、`MEDIUMTEXT`、`LONGTEXT`和`BLOB`、`MEDIUMBLOB`、`LONGBLOB`三种不同的类型,它们主要的区别在于存储数据的最大大小不同。保存浮点数可以用`FLOAT`或`DOUBLE`类型,`FLOAT`已经不推荐使用了,而且在 MySQL 后续的版本中可能会被移除掉。而保存定点数应该使用`DECIMAL`类型。如果要保存时间日期,`DATETIME`类型优于`TIMESTAMP`类型,因为前者能表示的时间日期范围更大。 - -#### DML(数据操作语言) - -我们通过如下所示的 SQL 给上面创建的表添加数据。 - -```SQL -use school; - --- 插入学院数据 -insert into `tb_college` - (`col_name`, `col_intro`) -values - ('计算机学院', '计算机学院1958年设立计算机专业,1981年建立计算机科学系,1998年设立计算机学院,2005年5月,为了进一步整合教学和科研资源,学校决定,计算机学院和软件学院行政班子合并统一运作、实行教学和学生管理独立运行的模式。 学院下设三个系:计算机科学与技术系、物联网工程系、计算金融系;两个研究所:图象图形研究所、网络空间安全研究院(2015年成立);三个教学实验中心:计算机基础教学实验中心、IBM技术中心和计算机专业实验中心。'), - ('外国语学院', '外国语学院设有7个教学单位,6个文理兼收的本科专业;拥有1个一级学科博士授予点,3个二级学科博士授予点,5个一级学科硕士学位授权点,5个二级学科硕士学位授权点,5个硕士专业授权领域,同时还有2个硕士专业学位(MTI)专业;有教职员工210余人,其中教授、副教授80余人,教师中获得中国国内外名校博士学位和正在职攻读博士学位的教师比例占专任教师的60%以上。'), - ('经济管理学院', '经济学院前身是创办于1905年的经济科;已故经济学家彭迪先、张与九、蒋学模、胡寄窗、陶大镛、胡代光,以及当代学者刘诗白等曾先后在此任教或学习。'); - --- 插入学生数据 -insert into `tb_student` - (`stu_id`, `stu_name`, `stu_sex`, `stu_birth`, `stu_addr`, `col_id`) -values - (1001, '杨过', 1, '1990-3-4', '湖南长沙', 1), - (1002, '任我行', 1, '1992-2-2', '湖南长沙', 1), - (1033, '王语嫣', 0, '1989-12-3', '四川成都', 1), - (1572, '岳不群', 1, '1993-7-19', '陕西咸阳', 1), - (1378, '纪嫣然', 0, '1995-8-12', '四川绵阳', 1), - (1954, '林平之', 1, '1994-9-20', '福建莆田', 1), - (2035, '东方不败', 1, '1988-6-30', null, 2), - (3011, '林震南', 1, '1985-12-12', '福建莆田', 3), - (3755, '项少龙', 1, '1993-1-25', '四川成都', 3), - (3923, '杨不悔', 0, '1985-4-17', '四川成都', 3); - --- 插入老师数据 -insert into `tb_teacher` - (`tea_id`, `tea_name`, `tea_title`, `col_id`) -values - (1122, '张三丰', '教授', 1), - (1133, '宋远桥', '副教授', 1), - (1144, '杨逍', '副教授', 1), - (2255, '范遥', '副教授', 2), - (3366, '韦一笑', default, 3); - --- 插入课程数据 -insert into `tb_course` - (`cou_id`, `cou_name`, `cou_credit`, `tea_id`) -values - (1111, 'Python程序设计', 3, 1122), - (2222, 'Web前端开发', 2, 1122), - (3333, '操作系统', 4, 1122), - (4444, '计算机网络', 2, 1133), - (5555, '编译原理', 4, 1144), - (6666, '算法和数据结构', 3, 1144), - (7777, '经贸法语', 3, 2255), - (8888, '成本会计', 2, 3366), - (9999, '审计学', 3, 3366); - --- 插入选课数据 -insert into `tb_record` - (`stu_id`, `cou_id`, `sel_date`, `score`) -values - (1001, 1111, '2017-09-01', 95), - (1001, 2222, '2017-09-01', 87.5), - (1001, 3333, '2017-09-01', 100), - (1001, 4444, '2018-09-03', null), - (1001, 6666, '2017-09-02', 100), - (1002, 1111, '2017-09-03', 65), - (1002, 5555, '2017-09-01', 42), - (1033, 1111, '2017-09-03', 92.5), - (1033, 4444, '2017-09-01', 78), - (1033, 5555, '2017-09-01', 82.5), - (1572, 1111, '2017-09-02', 78), - (1378, 1111, '2017-09-05', 82), - (1378, 7777, '2017-09-02', 65.5), - (2035, 7777, '2018-09-03', 88), - (2035, 9999, '2019-09-02', null), - (3755, 1111, '2019-09-02', null), - (3755, 8888, '2019-09-02', null), - (3755, 9999, '2017-09-01', 92); -``` - -> **注意**:上面的`insert`语句使用了批处理的方式来插入数据,这种做法插入数据的效率比较高。 - -#### DQL(数据查询语言) - -接下来,我们完成如下所示的查询。 - -```SQL --- 查询所有学生的所有信息 -select * from `tb_student`; - --- 查询学生的学号、姓名和籍贯(投影) -select `stu_id`, `stu_name`, `stu_addr` from `tb_student`; - --- 查询所有课程的名称及学分(投影和别名) -select `cou_name` as 课程名称, `cou_credit` as 学分 from `tb_course`; - --- 查询所有女学生的姓名和出生日期(筛选) -select `stu_name`, `stu_birth` from `tb_student` where `stu_sex`=0; - --- 查询籍贯为“四川成都”的女学生的姓名和出生日期(筛选) -select `stu_name`, `stu_birth` from `tb_student` where `stu_sex`=0 and `stu_addr`='四川成都'; - --- 查询籍贯为“四川成都”或者性别为“女生”的学生 -select `stu_name`, `stu_birth` from `tb_student` where `stu_sex`=0 or `stu_addr`='四川成都'; - --- 查询所有80后学生的姓名、性别和出生日期(筛选) -select `stu_name`, `stu_sex`, `stu_birth` from `tb_student` -where `stu_birth`>='1980-1-1' and `stu_birth`<='1989-12-31'; - -select `stu_name`, `stu_sex`, `stu_birth` from `tb_student` -where `stu_birth` between '1980-1-1' and '1989-12-31'; - --- 补充:将表示性别的 1 和 0 处理成 “男” 和 “女” -select - `stu_name` as 姓名, - if(`stu_sex`, '男', '女') as 性别, - `stu_birth` as 出生日期 -from `tb_student` -where `stu_birth` between '1980-1-1' and '1989-12-31'; - -select - `stu_name` as 姓名, - case `stu_sex` when 1 then '男' else '女' end as 性别, - `stu_birth` as 出生日期 -from `tb_student` -where `stu_birth` between '1980-1-1' and '1989-12-31'; - --- 查询学分大于2的课程的名称和学分(筛选) -select `cou_name`, `cou_credit` from `tb_course` where `cou_credit`>2; - --- 查询学分是奇数的课程的名称和学分(筛选) -select `cou_name`, `cou_credit` from `tb_course` where `cou_credit`%2<>0; - -select `cou_name`, `cou_credit` from `tb_course` where `cou_credit` mod 2<>0; - --- 查询选择选了1111的课程考试成绩在90分以上的学生学号(筛选) -select `stu_id` from `tb_record` where `cou_id`=1111 and `score`>90; - --- 查询名字叫“杨过”的学生的姓名和性别 -select `stu_name`, `stu_sex` from `tb_student` where `stu_name`='杨过'; - --- 查询姓“杨”的学生姓名和性别(模糊) --- % - 通配符(wildcard),它可以匹配0个或任意多个字符 -select `stu_name`, `stu_sex` from `tb_student` where `stu_name` like '杨%'; - --- 查询姓“杨”名字两个字的学生姓名和性别(模糊) --- _ - 通配符(wildcard),它可以精确匹配一个字符 -select `stu_name`, `stu_sex` from `tb_student` where `stu_name` like '杨_'; - --- 查询姓“杨”名字三个字的学生姓名和性别(模糊) -select `stu_name`, `stu_sex` from `tb_student` where `stu_name` like '杨__'; - --- 查询名字中有“不”字或“嫣”字的学生的姓名(模糊) -select `stu_name` from `tb_student` where `stu_name` like '%不%' or `stu_name` like '%嫣%'; - --- 将“岳不群”改名为“岳不嫣”,比较下面两个查询的区别 -update `tb_student` set `stu_name`='岳不嫣' where `stu_id`=1572; - -select `stu_name` from `tb_student` where `stu_name` like '%不%' -union -select `stu_name` from `tb_student` where `stu_name` like '%嫣%'; - -select `stu_name` from `tb_student` where `stu_name` like '%不%' -union all -select `stu_name` from `tb_student` where `stu_name` like '%嫣%'; - --- 查询姓“杨”或姓“林”名字三个字的学生的姓名(正则表达式模糊查询) -select `stu_name` from `tb_student` where `stu_name` regexp '[杨林].{2}'; - --- 查询没有录入籍贯的学生姓名(空值处理) -select `stu_name` from `tb_student` where `stu_addr` is null; - -select `stu_name` from `tb_student` where `stu_addr` <=> null; - --- 查询录入了籍贯的学生姓名(空值处理) -select `stu_name` from `tb_student` where `stu_addr` is not null; - --- 下面的查询什么也查不到,三值逻辑 --> true / false / unknown -select `stu_name` from `tb_student` where `stu_addr`=null or `stu_addr`<>null; - --- 查询学生选课的所有日期(去重) -select distinct `sel_date` from `tb_record`; - --- 查询学生的籍贯(去重) -select distinct `stu_addr` from `tb_student` where `stu_addr` is not null; - --- 查询男学生的姓名和生日按年龄从大到小排列(排序) --- 升序:从小到大 - asc,降序:从大到小 - desc -select `stu_id`, `stu_name`, `stu_birth` from `tb_student` -where `stu_sex`=1 order by `stu_birth` asc, `stu_id` desc; - --- 补充:将上面的生日换算成年龄(日期函数、数值函数) -select - `stu_id` as 学号, - `stu_name` as 姓名, - floor(datediff(curdate(), `stu_birth`)/365) as 年龄 -from `tb_student` -where `stu_sex`=1 order by 年龄 desc, `stu_id` desc; - --- 查询年龄最大的学生的出生日期(聚合函数) -select min(`stu_birth`) from `tb_student`; - --- 查询年龄最小的学生的出生日期(聚合函数) -select max(`stu_birth`) from `tb_student`; - --- 查询编号为1111的课程考试成绩的最高分(聚合函数) -select max(`score`) from `tb_record` where `cou_id`=1111; - --- 查询学号为1001的学生考试成绩的最低分(聚合函数) -select min(`score`) from `tb_record` where `stu_id`=1001; - --- 查询学号为1001的学生考试成绩的平均分(聚合函数) -select avg(`score`) from `tb_record` where `stu_id`=1001; - -select sum(`score`) / count(`score`) from `tb_record` where `stu_id`=1001; - --- 查询学号为1001的学生考试成绩的平均分,如果有null值,null值算0分(聚合函数) -select sum(`score`) / count(*) from `tb_record` where `stu_id`=1001; - -select avg(ifnull(`score`, 0)) from `tb_record` where `stu_id`=1001; - --- 查询学号为1001的学生考试成绩的标准差(聚合函数) -select std(`score`), variance(`score`) from `tb_record` where `stu_id`=1001; - --- 查询男女学生的人数(分组和聚合函数) -select - case `stu_sex` when 1 then '男' else '女' end as 性别, - count(*) as 人数 -from `tb_student` group by `stu_sex`; - --- 查询每个学院学生人数(分组和聚合函数) -select - `col_id` as 学院, - count(*) as 人数 -from `tb_student` group by `col_id` with rollup; - --- 查询每个学院男女学生人数(分组和聚合函数) -select - `col_id` as 学院, - if(`stu_sex`, '男', '女') as 性别, - count(*) as 人数 -from `tb_student` group by `col_id`, `stu_sex`; - --- 查询每个学生的学号和平均成绩(分组和聚合函数) -select - `stu_id`, - round(avg(`score`), 1) as avg_score -from `tb_record` group by `stu_id`; - --- 查询平均成绩大于等于90分的学生的学号和平均成绩 --- 分组以前的筛选使用where子句,分组以后的筛选使用having子句 -select - `stu_id`, - round(avg(`score`), 1) as avg_score -from `tb_record` -group by `stu_id` having avg_score>=90; - --- 查询1111、2222、3333三门课程平均成绩大于等于90分的学生的学号和平均成绩 -select - `stu_id`, - round(avg(`score`), 1) as avg_score -from `tb_record` where `cou_id` in (1111, 2222, 3333) -group by `stu_id` having avg_score>=90; - --- 查询年龄最大的学生的姓名(子查询/嵌套查询) --- 嵌套查询:把一个select的结果作为另一个select的一部分来使用 -select `stu_name` from `tb_student` -where `stu_birth`=( - select min(`stu_birth`) from `tb_student` -); - --- 查询选了两门以上的课程的学生姓名(子查询/分组条件/集合运算) -select `stu_name` from `tb_student` -where `stu_id` in ( - select `stu_id` from `tb_record` - group by `stu_id` having count(*)>2 -); - --- 查询学生的姓名、生日和所在学院名称 -select `stu_name`, `stu_birth`, `col_name` -from `tb_student`, `tb_college` -where `tb_student`.`col_id`=`tb_college`.`col_id`; - -select `stu_name`, `stu_birth`, `col_name` -from `tb_student` inner join `tb_college` -on `tb_student`.`col_id`=`tb_college`.`col_id`; - -select `stu_name`, `stu_birth`, `col_name` -from `tb_student` natural join `tb_college`; - --- 查询学生姓名、课程名称以及成绩(连接查询/联结查询) -select `stu_name`, `cou_name`, `score` -from `tb_student`, `tb_course`, `tb_record` -where `tb_student`.`stu_id`=`tb_record`.`stu_id` -and `tb_course`.`cou_id`=`tb_record`.`cou_id` -and `score` is not null; - -select `stu_name`, `cou_name`, `score` from `tb_student` -inner join `tb_record` on `tb_student`.`stu_id`=`tb_record`.`stu_id` -inner join `tb_course` on `tb_course`.`cou_id`=`tb_record`.`cou_id` -where `score` is not null; - -select `stu_name`, `cou_name`, `score` from `tb_student` -natural join `tb_record` -natural join `tb_course` -where `score` is not null; - --- 补充:上面的查询结果取前5条数据(分页查询) -select `stu_name`, `cou_name`, `score` -from `tb_student`, `tb_course`, `tb_record` -where `tb_student`.`stu_id`=`tb_record`.`stu_id` -and `tb_course`.`cou_id`=`tb_record`.`cou_id` -and `score` is not null -order by `score` desc -limit 0,5; - --- 补充:上面的查询结果取第6-10条数据(分页查询) -select `stu_name`, `cou_name`, `score` -from `tb_student`, `tb_course`, `tb_record` -where `tb_student`.`stu_id`=`tb_record`.`stu_id` -and `tb_course`.`cou_id`=`tb_record`.`cou_id` -and `score` is not null -order by `score` desc -limit 5 offset 5; - --- 补充:上面的查询结果取第11-15条数据(分页查询) -select `stu_name`, `cou_name`, `score` -from `tb_student`, `tb_course`, `tb_record` -where `tb_student`.`stu_id`=`tb_record`.`stu_id` -and `tb_course`.`cou_id`=`tb_record`.`cou_id` -and `score` is not null -order by `score` desc -limit 5 offset 10; - --- 查询选课学生的姓名和平均成绩(子查询和连接查询) -select `stu_name`, `avg_score` -from `tb_student` inner join ( - select `stu_id` as `sid`, round(avg(`score`), 1) as avg_score - from `tb_record` group by `stu_id` -) as `t2` on `stu_id`=`sid`; - --- 查询学生的姓名和选课的数量 -select `stu_name`, `total` from `tb_student` as `t1` -inner join ( - select `stu_id`, count(*) as `total` - from `tb_record` group by `stu_id` -) as `t2` on `t1`.`stu_id`=`t2`.`stu_id`; - --- 查询每个学生的姓名和选课数量(左外连接和子查询) --- 左外连接:左表(写在join左边的表)的每条记录都可以查出来,不满足连表条件的地方填充null。 -select `stu_name`, coalesce(`total`, 0) as `total` -from `tb_student` as `t1` -left outer join ( - select `stu_id`, count(*) as `total` - from `tb_record` group by `stu_id` -) as `t2` on `t1`.`stu_id`=`t2`.`stu_id`; - --- 修改选课记录表,去掉 stu_id 列的外键约束 -alter table `tb_record` drop foreign key `fk_record_stu_id`; - --- 插入两条新纪录(注意:没有学号为 5566 的学生) -insert into `tb_record` -values - (default, 5566, 1111, '2019-09-02', 80), - (default, 5566, 2222, '2019-09-02', 70); - --- 右外连接:右表(写在join右边的表)的每条记录都可以查出来,不满足连表条件的地方填充null。 -select `stu_name`, `total` from `tb_student` as `t1` -right outer join ( - select `stu_id`, count(*) as `total` - from `tb_record` group by `stu_id` -) as `t2` on `t1`.`stu_id`=`t2`.`stu_id`; - --- 全外连接:左表和右表的每条记录都可以查出来,不满足连表条件的地方填充null。 --- 说明:MySQL不支持全外连接,所以用左外连接和右外连接的并集来表示。 -select `stu_name`, `total` -from `tb_student` as `t1` -left outer join ( - select `stu_id`, count(*) as `total` - from `tb_record` group by `stu_id` -) as `t2` on `t1`.`stu_id`=`t2`.`stu_id` -union -select `stu_name`, `total` from `tb_student` as `t1` -right outer join ( - select `stu_id`, count(*) as `total` - from `tb_record` group by `stu_id` -) as `t2` on `t1`.`stu_id`=`t2`.`stu_id`; -``` - -上面的DML有几个地方需要加以说明: - -1. MySQL目前的版本不支持全外连接,上面我们通过`union`操作,将左外连接和右外连接的结果求并集实现全外连接的效果。大家可以通过下面的图来加深对连表操作的认识。 - - - -2. MySQL 中支持多种类型的运算符,包括:算术运算符(`+`、`-`、`*`、`/`、`%`)、比较运算符(`=`、`<>`、`<=>`、`<`、`<=`、`>`、`>=`、`BETWEEN...AND..`.、`IN`、`IS NULL`、`IS NOT NULL`、`LIKE`、`RLIKE`、`REGEXP`)、逻辑运算符(`NOT`、`AND`、`OR`、`XOR`)和位运算符(`&`、`|`、`^`、`~`、`>>`、`<<`),我们可以在 DML 中使用这些运算符处理数据。 - -3. 在查询数据时,可以在`SELECT`语句及其子句(如`WHERE`子句、`ORDER BY`子句、`HAVING`子句等)中使用函数,这些函数包括字符串函数、数值函数、时间日期函数、流程函数等,如下面的表格所示。 - - 常用字符串函数。 - - | 函数 | 功能 | - | --------------------------- | ----------------------------------------------------- | - | `CONCAT` | 将多个字符串连接成一个字符串 | - | `FORMAT` | 将数值格式化成字符串并指定保留几位小数 | - | `FROM_BASE64` / `TO_BASE64` | BASE64解码/编码 | - | `BIN` / `OCT` / `HEX` | 将数值转换成二进制/八进制/十六进制字符串 | - | `LOCATE` | 在字符串中查找一个子串的位置 | - | `LEFT` / `RIGHT` | 返回一个字符串左边/右边指定长度的字符 | - | `LENGTH` / `CHAR_LENGTH` | 返回字符串的长度以字节/字符为单位 | - | `LOWER` / `UPPER` | 返回字符串的小写/大写形式 | - | `LPAD` / `RPAD` | 如果字符串的长度不足,在字符串左边/右边填充指定的字符 | - | `LTRIM` / `RTRIM` | 去掉字符串前面/后面的空格 | - | `ORD` / `CHAR` | 返回字符对应的编码/返回编码对应的字符 | - | `STRCMP` | 比较字符串,返回-1、0、1分别表示小于、等于、大于 | - | `SUBSTRING` | 返回字符串指定范围的子串 | - - 常用数值函数。 - - | 函数 | 功能 | - | -------------------------------------------------------- | ---------------------------------- | - | `ABS` | 返回一个数的绝度值 | - | `CEILING` / `FLOOR` | 返回一个数上取整/下取整的结果 | - | `CONV` | 将一个数从一种进制转换成另一种进制 | - | `CRC32` | 计算循环冗余校验码 | - | `EXP` / `LOG` / `LOG2` / `LOG10` | 计算指数/对数 | - | `POW` | 求幂 | - | `RAND` | 返回[0,1)范围的随机数 | - | `ROUND` | 返回一个数四舍五入后的结果 | - | `SQRT` | 返回一个数的平方根 | - | `TRUNCATE` | 截断一个数到指定的精度 | - | `SIN` / `COS` / `TAN` / `COT` / `ASIN` / `ACOS` / `ATAN` | 三角函数 | - - 常用时间日期函数。 - - | 函数 | 功能 | - | ----------------------------- | ------------------------------------- | - | `CURDATE` / `CURTIME` / `NOW` | 获取当前日期/时间/日期和时间 | - | `ADDDATE` / `SUBDATE` | 将两个日期表达式相加/相减并返回结果 | - | `DATE` / `TIME` | 从字符串中获取日期/时间 | - | `YEAR` / `MONTH` / `DAY` | 从日期中获取年/月/日 | - | `HOUR` / `MINUTE` / `SECOND` | 从时间中获取时/分/秒 | - | `DATEDIFF` / `TIMEDIFF` | 返回两个时间日期表达式相差多少天/小时 | - | `MAKEDATE` / `MAKETIME` | 制造一个日期/时间 | - - 常用流程函数。 - - | 函数 | 功能 | - | -------- | ------------------------------------------------ | - | `IF` | 根据条件是否成立返回不同的值 | - | `IFNULL` | 如果为NULL则返回指定的值否则就返回本身 | - | `NULLIF` | 两个表达式相等就返回NULL否则返回第一个表达式的值 | - - 其他常用函数。 - - | 函数 | 功能 | - | -------------------------- | ----------------------------- | - | `MD5` / `SHA1` / `SHA2` | 返回字符串对应的哈希摘要 | - | `CHARSET` / `COLLATION` | 返回字符集/校对规则 | - | `USER` / `CURRENT_USER` | 返回当前用户 | - | `DATABASE` | 返回当前数据库名 | - | `VERSION` | 返回当前数据库版本 | - | `FOUND_ROWS` / `ROW_COUNT` | 返回查询到的行数/受影响的行数 | - | `LAST_INSERT_ID` | 返回最后一个自增主键的值 | - | `UUID` / `UUID_SHORT` | 返回全局唯一标识符 | - -#### DCL(数据控制语言) - -数据控制语言用于给指定的用户授权或者从召回指定用户的指定权限,这组操作对数据库管理员来说比较重要,将一个用户的权限最小化(刚好够用)是非常重要的,对数据库的安全至关重要。 - -```SQL --- 创建名为 wangdachui 的账号并为其指定口令,允许该账号从任意主机访问 -create user 'wangdachui'@'%' identified by '123456'; - --- 授权 wangdachui 可以对名为school的数据库执行 select 和 insert 操作 -grant select, insert on `school`.* to 'wangdachui'@'%'; - --- 召回 wangdachui 对school数据库的 insert 权限 -revoke insert on `school`.* from 'wangdachui'@'%'; -``` - -> **说明**:创建一个可以允许任意主机登录并且具有超级管理员权限的用户在现实中并不是一个明智的决定,因为一旦该账号的口令泄露或者被破解,数据库将会面临灾难级的风险。 - -### MySQL 详解 - -#### 索引 - -索引是关系型数据库中用来提升查询性能最为重要的手段。关系型数据库中的索引就像一本书的目录,我们可以想象一下,如果要从一本书中找出某个知识点,但是这本书没有目录,这将是意见多么可怕的事情!我们估计得一篇一篇的翻下去,才能确定这个知识点到底在什么位置。创建索引虽然会带来存储空间上的开销,就像一本书的目录会占用一部分篇幅一样,但是在牺牲空间后换来的查询时间的减少也是非常显著的。 - -MySQL 数据库中所有数据类型的列都可以被索引。对于MySQL 8.0 版本的 InnoDB 存储引擎来说,它支持三种类型的索引,分别是 B+ 树索引、全文索引和 R 树索引。这里,我们只介绍使用得最为广泛的 B+ 树索引。使用 B+ 树的原因非常简单,因为它是目前在基于磁盘进行海量数据存储和排序上最有效率的数据结构。B+ 树是一棵[平衡树](https://zh.wikipedia.org/zh-cn/%E5%B9%B3%E8%A1%A1%E6%A0%91),树的高度通常为3或4,但是却可以保存从百万级到十亿级的数据,而从这些数据里面查询一条数据,只需要3次或4次 I/O 操作。 - -B+ 树由根节点、中间节点和叶子节点构成,其中叶子节点用来保存排序后的数据。由于记录在索引上是排序过的,因此在一个叶子节点内查找数据时可以使用二分查找,这种查找方式效率非常的高。当数据很少的时候,B+ 树只有一个根节点,数据也就保存在根节点上。随着记录越来越多,B+ 树会发生分裂,根节点不再保存数据,而是提供了访问下一层节点的指针,帮助快速确定数据在哪个叶子节点上。 - -在创建二维表时,我们通常都会为表指定主键列,主键列上默认会创建索引,而对于 MySQL InnoDB 存储引擎来说,因为它使用的是索引组织表这种数据存储结构,所以主键上的索引就是整张表的数据,而这种索引我们也将其称之为**聚集索引**(clustered index)。很显然,一张表只能有一个聚集索引,否则表的数据岂不是要保存多次。我们自己创建的索引都是二级索引(secondary index),更常见的叫法是**非聚集索引**(non-clustered index)。通过我们自定义的非聚集索引只能定位记录的主键,在获取数据时可能需要再通过主键上的聚集索引进行查询,这种现象称为“回表”,因此通过非聚集索引检索数据通常比使用聚集索引检索数据要慢。 - -接下来我们通过一个简单的例子来说明索引的意义,比如我们要根据学生的姓名来查找学生,这个场景在实际开发中应该经常遇到,就跟通过商品名称查找商品是一个道理。我们可以使用 MySQL 的`explain`关键字来查看 SQL 的执行计划(数据库执行 SQL 语句的具体步骤)。 - -```SQL -explain select * from tb_student where stuname='林震南'\G -``` - -``` -*************************** 1. row *************************** - id: 1 - select_type: SIMPLE - table: tb_student - partitions: NULL - type: ALL -possible_keys: NULL - key: NULL - key_len: NULL - ref: NULL - rows: 11 - filtered: 10.00 - Extra: Using where -1 row in set, 1 warning (0.00 sec) -``` - -在上面的 SQL 执行计划中,有几项值得我们关注: - -1. `select_type`:查询的类型。 - - `SIMPLE`:简单 SELECT,不需要使用 UNION 操作或子查询。 - - `PRIMARY`:如果查询包含子查询,最外层的 SELECT 被标记为 PRIMARY。 - - `UNION`:UNION 操作中第二个或后面的 SELECT 语句。 - - `SUBQUERY`:子查询中的第一个 SELECT。 - - `DERIVED`:派生表的 SELECT 子查询。 -2. `table`:查询对应的表。 -3. `type`:MySQL 在表中找到满足条件的行的方式,也称为访问类型,包括:`ALL`(全表扫描)、`index`(索引全扫描,只遍历索引树)、`range`(索引范围扫描)、`ref`(非唯一索引扫描)、`eq_ref`(唯一索引扫描)、`const` / `system`(常量级查询)、`NULL`(不需要访问表或索引)。在所有的访问类型中,很显然 ALL 是性能最差的,它代表的全表扫描是指要扫描表中的每一行才能找到匹配的行。 -4. `possible_keys`:MySQL 可以选择的索引,但是**有可能不会使用**。 -5. `key`:MySQL 真正使用的索引,如果为`NULL`就表示没有使用索引。 -6. `key_len`:使用的索引的长度,在不影响查询的情况下肯定是长度越短越好。 -7. `rows`:执行查询需要扫描的行数,这是一个**预估值**。 -8. `extra`:关于查询额外的信息。 - - `Using filesort`:MySQL 无法利用索引完成排序操作。 - - `Using index`:只使用索引的信息而不需要进一步查表来获取更多的信息。 - - `Using temporary`:MySQL 需要使用临时表来存储结果集,常用于分组和排序。 - - `Impossible where`:`where`子句会导致没有符合条件的行。 - - `Distinct`:MySQL 发现第一个匹配行后,停止为当前的行组合搜索更多的行。 - - `Using where`:查询的列未被索引覆盖,筛选条件并不是索引的前导列。 - -从上面的执行计划可以看出,当我们通过学生名字查询学生时实际上是进行了全表扫描,不言而喻这个查询性能肯定是非常糟糕的,尤其是在表中的行很多的时候。如果我们需要经常通过学生姓名来查询学生,那么就应该在学生姓名对应的列上创建索引,通过索引来加速查询。 - -```SQL -create index idx_student_name on tb_student(stuname); -``` - -再次查看刚才的 SQL 对应的执行计划。 - -```SQL -explain select * from tb_student where stuname='林震南'\G -``` - -``` -*************************** 1. row *************************** - id: 1 - select_type: SIMPLE - table: tb_student - partitions: NULL - type: ref -possible_keys: idx_student_name - key: idx_student_name - key_len: 62 - ref: const - rows: 1 - filtered: 100.00 - Extra: NULL -1 row in set, 1 warning (0.00 sec) -``` - -可以注意到,在对学生姓名创建索引后,刚才的查询已经不是全表扫描而是基于索引的查询,而且扫描的行只有唯一的一行,这显然大大的提升了查询的性能。MySQL 中还允许创建前缀索引,即对索引字段的前N个字符创建索引,这样的话可以减少索引占用的空间(但节省了空间很有可能会浪费时间,**时间和空间是不可调和的矛盾**),如下所示。 - -```SQL -create index idx_student_name_1 on tb_student(stuname(1)); -``` - -上面的索引相当于是根据学生姓名的第一个字来创建的索引,我们再看看 SQL 执行计划。 - -```SQL -explain select * from tb_student where stuname='林震南'\G -``` - -``` -*************************** 1. row *************************** - id: 1 - select_type: SIMPLE - table: tb_student - partitions: NULL - type: ref -possible_keys: idx_student_name - key: idx_student_name - key_len: 5 - ref: const - rows: 2 - filtered: 100.00 - Extra: Using where -1 row in set, 1 warning (0.00 sec) -``` - -不知道大家是否注意到,这一次扫描的行变成了2行,因为学生表中有两个姓“林”的学生,我们只用姓名的第一个字作为索引的话,在查询时通过索引就会找到这两行。 - -如果要删除索引,可以使用下面的SQL。 - -```SQL -alter table tb_student drop index idx_student_name; -``` - -或者 - -```SQL -drop index idx_student_name on tb_student; -``` - -在创建索引时,我们还可以使用复合索引、函数索引(MySQL 5.7 开始支持),用好复合索引实现**索引覆盖**可以减少不必要的排序和回表操作,这样就会让查询的性能成倍的提升,有兴趣的读者可以自行研究。 - -我们简单的为大家总结一下索引的设计原则: - -1. **最适合**索引的列是出现在**WHERE子句**和连接子句中的列。 -2. 索引列的基数越大(取值多、重复值少),索引的效果就越好。 -3. 使用**前缀索引**可以减少索引占用的空间,内存中可以缓存更多的索引。 -4. **索引不是越多越好**,虽然索引加速了读操作(查询),但是写操作(增、删、改)都会变得更慢,因为数据的变化会导致索引的更新,就如同书籍章节的增删需要更新目录一样。 -5. 使用 InnoDB 存储引擎时,表的普通索引都会保存主键的值,所以**主键要尽可能选择较短的数据类型**,这样可以有效的减少索引占用的空间,提升索引的缓存效果。 - -最后,还有一点需要说明,InnoDB 使用的 B-tree 索引,数值类型的列除了等值判断时索引会生效之外,使用`>`、`<`、`>=`、`<=`、`BETWEEN...AND... `、`<>`时,索引仍然生效;对于字符串类型的列,如果使用不以通配符开头的模糊查询,索引也是起作用的,但是其他的情况会导致索引失效,这就意味着很有可能会做全表查询。 - -#### 视图 - -视图是关系型数据库中将一组查询指令构成的结果集组合成可查询的数据表的对象。简单的说,视图就是虚拟的表,但与数据表不同的是,数据表是一种实体结构,而视图是一种虚拟结构,你也可以将视图理解为保存在数据库中被赋予名字的 SQL 语句。 - -使用视图可以获得以下好处: - -1. 可以将实体数据表隐藏起来,让外部程序无法得知实际的数据结构,让访问者可以使用表的组成部分而不是整个表,降低数据库被攻击的风险。 -2. 在大多数的情况下视图是只读的(更新视图的操作通常都有诸多的限制),外部程序无法直接透过视图修改数据。 -3. 重用 SQL 语句,将高度复杂的查询包装在视图表中,直接访问该视图即可取出需要的数据;也可以将视图视为数据表进行连接查询。 -4. 视图可以返回与实体数据表不同格式的数据,在创建视图的时候可以对数据进行格式化处理。 - -创建视图。 - -```SQL --- 创建视图 -create view `vw_avg_score` -as - select `stu_id`, round(avg(`score`), 1) as `avg_score` - from `tb_record` group by `stu_id`; - --- 基于已有的视图创建视图 -create view `vw_student_score` -as - select `stu_name`, `avg_score` - from `tb_student` natural join `vw_avg_score`; -``` - -> **提示**:因为视图不包含数据,所以每次使用视图时,都必须执行查询以获得数据,如果你使用了连接查询、嵌套查询创建了较为复杂的视图,你可能会发现查询性能下降得很厉害。因此,在使用复杂的视图前,应该进行测试以确保其性能能够满足应用的需求。 - -使用视图。 - -```SQL -select * from `vw_student_score` order by `avg_score` desc; -``` - -``` -+--------------+----------+ -| stuname | avgscore | -+--------------+----------+ -| 杨过 | 95.6 | -| 任我行 | 53.5 | -| 王语嫣 | 84.3 | -| 纪嫣然 | 73.8 | -| 岳不群 | 78.0 | -| 东方不败 | 88.0 | -| 项少龙 | 92.0 | -+--------------+----------+ -``` - -既然视图是一张虚拟的表,那么视图的中的数据可以更新吗?视图的可更新性要视具体情况而定,以下类型的视图是不能更新的: - -1. 使用了聚合函数(`SUM`、`MIN`、`MAX`、`AVG`、`COUNT`等)、`DISTINCT`、`GROUP BY`、`HAVING`、`UNION`或者`UNION ALL`的视图。 -2. `SELECT`中包含了子查询的视图。 -3. `FROM`子句中包含了一个不能更新的视图的视图。 -4. `WHERE`子句的子查询引用了`FROM`子句中的表的视图。 - -删除视图。 - -```SQL -drop view vw_student_score; -``` - -> **说明**:如果希望更新视图,可以先用上面的命令删除视图,也可以通过`create or replace view`来更新视图。 - -视图的规则和限制。 - -1. 视图可以嵌套,可以利用从其他视图中检索的数据来构造一个新的视图。视图也可以和表一起使用。 -2. 创建视图时可以使用`order by`子句,但如果从视图中检索数据时也使用了`order by`,那么该视图中原先的`order by`会被覆盖。 -3. 视图无法使用索引,也不会激发触发器(实际开发中因为性能等各方面的考虑,通常不建议使用触发器,所以我们也不对这个概念进行介绍)的执行。 - -#### 函数 - -MySQL 中的函数跟 Python 中的函数太多的差异,因为函数都是用来封装功能上相对独立且会被重复使用的代码的。如果非要找出一些差别来,那么 MySQL 中的函数是可以执行 SQL 语句的。下面的例子,我们通过自定义函数实现了截断超长字符串的功能。 - -```SQL -delimiter $$ - -create function truncate_string( - content varchar(10000), - max_length int unsigned -) returns varchar(10000) no sql -begin - declare result varchar(10000) default content; - if char_length(content) > max_length then - set result = left(content, max_length); - set result = concat(result, '……'); - end if; - return result; -end $$ - -delimiter ; -``` - -> **说明1**:函数声明后面的`no sql`是声明函数体并没有使用 SQL 语句;如果函数体中需要通过 SQL 读取数据,需要声明为`reads sql data`。 -> -> **说明2**:定义函数前后的`delimiter`命令是为了修改定界符,因为函数体中的语句都是用`;`表示结束,如果不重新定义定界符,那么遇到的`;`的时候代码就会被截断执行,显然这不是我们想要的效果。 - -在查询中调用自定义函数。 - -```SQL -select truncate_string('和我在成都的街头走一走,直到所有的灯都熄灭了也不停留', 10) as short_string; -``` - -``` -+--------------------------------------+ -| short_string | -+--------------------------------------+ -| 和我在成都的街头走一…… | -+--------------------------------------+ -``` - -#### 过程 - -过程(又称存储过程)是事先编译好存储在数据库中的一组 SQL 的集合,调用过程可以简化应用程序开发人员的工作,减少与数据库服务器之间的通信,对于提升数据操作的性能也是有帮助的。其实迄今为止,我们使用的 SQL 语句都是针对一个或多个表的单条语句,但在实际开发中经常会遇到某个操作需要多条 SQL 语句才能完成的情况。例如,电商网站在受理用户订单时,需要做以下一系列的处理。 - -1. 通过查询来核对库存中是否有对应的物品以及库存是否充足。 -2. 如果库存有物品,需要锁定库存以确保这些物品不再卖给别人, 并且要减少可用的物品数量以反映正确的库存量。 -3. 如果库存不足,可能需要进一步与供应商进行交互或者至少产生一条系统提示消息。 -4. 不管受理订单是否成功,都需要产生流水记录,而且需要给对应的用户产生一条通知信息。 - -我们可以通过过程将复杂的操作封装起来,这样不仅有助于保证数据的一致性,而且将来如果业务发生了变动,只需要调整和修改过程即可。对于调用过程的用户来说,过程并没有暴露数据表的细节,而且执行过程比一条条的执行一组 SQL 要快得多。 - -下面的过程实现了查询某门课程的最高分、最低分和平均分。 - -```SQL -drop procedure if exists sp_score_stat; - -delimiter $$ - -create procedure sp_score_stat( - courseId int, - out maxScore decimal(4,1), - out minScore decimal(4,1), - out avgScore decimal(4,1) -) -begin - select max(score) into maxScore from tb_record where cou_id=courseId; - select min(score) into minScore from tb_record where cou_id=courseId; - select avg(score) into avgScore from tb_record where cou_id=courseId; -end $$ - -delimiter ; -``` - -> **说明**:在定义过程时,因为可能需要书写多条 SQL,而分隔这些 SQL 需要使用分号作为分隔符,如果这个时候,仍然用分号表示整段代码结束,那么定义过程的 SQL 就会出现错误,所以上面我们用`delimiter $$`将整段代码结束的标记定义为`$$`,那么代码中的分号将不再表示整段代码的结束,整段代码只会在遇到`end $$`时才会执行。在定义完过程后,通过`delimiter ;`将结束符重新改回成分号(恢复现场)。 - -上面定义的过程有四个参数,其中第一个参数是输入参数,代表课程的编号,后面的参数都是输出参数,因为过程不能定义返回值,只能通过输出参数将执行结果带出,定义输出参数的关键字是`out`,默认情况下参数都是输入参数。 - -调用过程。 - -```SQL -call sp_score_stat(1111, @a, @b, @c); -``` - -获取输出参数的值。 - -```SQL -select @a as 最高分, @b as 最低分, @c as 平均分; -``` - -删除过程。 - -```SQL -drop procedure sp_score_stat; -``` - -在过程中,我们可以定义变量、条件,可以使用分支和循环语句,可以通过游标操作查询结果,还可以使用事件调度器,这些内容我们暂时不在此处进行介绍。虽然我们说了很多过程的好处,但是在实际开发中,如果频繁的使用过程并将大量复杂的运算放到过程中,会给据库服务器造成巨大的压力,而数据库往往都是性能瓶颈所在,使用过程无疑是雪上加霜的操作。所以,对于互联网产品开发,我们一般建议让数据库只做好存储,复杂的运算和处理交给应用服务器上的程序去完成,如果应用服务器变得不堪重负了,我们可以比较容易的部署多台应用服务器来分摊这些压力。 - -如果大家对上面讲到的视图、函数、过程包括我们没有讲到的触发器这些知识有兴趣,建议大家阅读 MySQL 的入门读物[《MySQL必知必会》](https://item.jd.com/12818982.html)进行一般性了解即可,因为这些知识点在大家将来的工作中未必用得上,学了也可能仅仅是为了应付面试而已。 - -### MySQL 新特性 - -#### JSON类型 - -很多开发者在使用关系型数据库做数据持久化的时候,常常感到结构化的存储缺乏灵活性,因为必须事先设计好所有的列以及对应的数据类型。在业务发展和变化的过程中,如果需要修改表结构,这绝对是比较麻烦和难受的事情。从 MySQL 5.7 版本开始,MySQL引入了对 JSON 数据类型的支持(MySQL 8.0 解决了 JSON 的日志性能瓶颈问题),用好 JSON 类型,其实就是打破了关系型数据库和非关系型数据库之间的界限,为数据持久化操作带来了更多的便捷。 - -JSON 类型主要分为 JSON 对象和 JSON数组两种,如下所示。 - -1. JSON 对象 - -```JSON -{"name": "骆昊", "tel": "13122335566", "QQ": "957658"} -``` - -2. JSON 数组 - -```JSON -[1, 2, 3] -``` - -```JSON -[{"name": "骆昊", "tel": "13122335566"}, {"name": "王大锤", "QQ": "123456"}] -``` - -哪些地方需要用到JSON类型呢?举一个简单的例子,现在很多产品的用户登录都支持多种方式,例如手机号、微信、QQ、新浪微博等,但是一般情况下我们又不会要求用户提供所有的这些信息,那么用传统的设计方式,就需要设计多个列来对应多种登录方式,可能还需要允许这些列存在空值,这显然不是很好的选择;另一方面,如果产品又增加了一种登录方式,那么就必然要修改之前的表结构,这就更让人痛苦了。但是,有了 JSON 类型,刚才的问题就迎刃而解了,我们可以做出如下所示的设计。 - -```SQL -create table `tb_test` -( -`user_id` bigint unsigned, -`login_info` json, -primary key (`user_id`) -) engine=innodb; - -insert into `tb_test` values - (1, '{"tel": "13122335566", "QQ": "654321", "wechat": "jackfrued"}'), - (2, '{"tel": "13599876543", "weibo": "wangdachui123"}'); -``` - -如果要查询用户的手机和微信号,可以用如下所示的 SQL 语句。 - -```SQL -select - `user_id`, - json_unquote(json_extract(`login_info`, '$.tel')) as 手机号, - json_unquote(json_extract(`login_info`, '$.wechat')) as 微信 -from `tb_test`; -``` - -``` -+---------+-------------+-----------+ -| user_id | 手机号 | 微信 | -+---------+-------------+-----------+ -| 1 | 13122335566 | jackfrued | -| 2 | 13599876543 | NULL | -+---------+-------------+-----------+ -``` - -因为支持 JSON 类型,MySQL 也提供了配套的处理 JSON 数据的函数,就像上面用到的`json_extract`和`json_unquote`。当然,上面的 SQL 还有更为便捷的写法,如下所示。 - -```SQL -select - `user_id`, - `login_info` ->> '$.tel' as 手机号, - `login_info` ->> '$.wechat' as 微信 -from `tb_test`; -``` - -再举个例子,如果我们的产品要实现用户画像功能(给用户打标签),然后基于用户画像给用户推荐平台的服务或消费品之类的东西,我们也可以使用 JSON 类型来保存用户画像数据,示意代码如下所示。 - -创建画像标签表。 - -```SQL -create table `tb_tags` -( -`tag_id` int unsigned not null comment '标签ID', -`tag_name` varchar(20) not null comment '标签名', -primary key (`tag_id`) -) engine=innodb; - -insert into `tb_tags` (`tag_id`, `tag_name`) -values - (1, '70后'), - (2, '80后'), - (3, '90后'), - (4, '00后'), - (5, '爱运动'), - (6, '高学历'), - (7, '小资'), - (8, '有房'), - (9, '有车'), - (10, '爱看电影'), - (11, '爱网购'), - (12, '常点外卖'); -``` - -为用户打标签。 - -```SQL -create table `tb_users_tags` -( -`user_id` bigint unsigned not null comment '用户ID', -`user_tags` json not null comment '用户标签' -) engine=innodb; - -insert into `tb_users_tags` values - (1, '[2, 6, 8, 10]'), - (2, '[3, 10, 12]'), - (3, '[3, 8, 9, 11]'); -``` - -接下来,我们通过一组查询来了解 JSON 类型的巧妙之处。 - -1. 查询爱看电影(有`10`这个标签)的用户ID。 - - ```SQL - select * from `tb_users` where 10 member of (user_tags->'$'); - ``` - -2. 查询爱看电影(有`10`这个标签)的80后(有`2`这个标签)用户ID。 - - ``` - select * from `tb_users` where json_contains(user_tags->'$', '[2, 10]'); - -3. 查询爱看电影或80后或90后的用户ID。 - - ```SQL - select `user_id` from `tb_users_tags` where json_overlaps(user_tags->'$', '[2, 3, 10]'); - ``` - -> **说明**:上面的查询用到了`member of`谓词和两个 JSON 函数,`json_contains`可以检查 JSON 数组是否包含了指定的元素,而`json_overlaps`可以检查 JSON 数组是否与指定的数组有重叠部分。 - -#### 窗口函数 - -MySQL 从8.0开始支持窗口函数,大多数商业数据库和一些开源数据库早已提供了对窗口函数的支持,有的也将其称之为 OLAP(联机分析和处理)函数,听名字就知道跟统计和分析相关。为了帮助大家理解窗口函数,我们先说说窗口的概念。 - -窗口可以理解为记录的集合,窗口函数也就是在满足某种条件的记录集合上执行的特殊函数,对于每条记录都要在此窗口内执行函数。窗口函数和我们上面讲到的聚合函数比较容易混淆,二者的区别主要在于聚合函数是将多条记录聚合为一条记录,窗口函数是每条记录都会执行,执行后记录条数不会变。窗口函数不仅仅是几个函数,它是一套完整的语法,函数只是该语法的一部分,基本语法如下所示: - -```SQL -<窗口函数> over (partition by <用于分组的列名> order by <用户排序的列名>) -``` - -上面语法中,窗口函数的位置可以放以下两种函数: - -1. 专用窗口函数,包括:`lead`、`lag`、`first_value`、`last_value`、`rank`、`dense_rank`和`row_number`等。 -2. 聚合函数,包括:`sum`、`avg`、`max`、`min`和`count`等。 - -下面为大家举几个使用窗口函数的简单例子,我们先用如下所示的 SQL 建库建表。 - -```SQL --- 创建名为hrs的数据库并指定默认的字符集 -create database `hrs` default charset utf8mb4; - --- 切换到hrs数据库 -use `hrs`; - --- 创建部门表 -create table `tb_dept` -( -`dno` int not null comment '编号', -`dname` varchar(10) not null comment '名称', -`dloc` varchar(20) not null comment '所在地', -primary key (`dno`) -); - --- 插入4个部门 -insert into `tb_dept` values - (10, '会计部', '北京'), - (20, '研发部', '成都'), - (30, '销售部', '重庆'), - (40, '运维部', '深圳'); - --- 创建员工表 -create table `tb_emp` -( -`eno` int not null comment '员工编号', -`ename` varchar(20) not null comment '员工姓名', -`job` varchar(20) not null comment '员工职位', -`mgr` int comment '主管编号', -`sal` int not null comment '员工月薪', -`comm` int comment '每月补贴', -`dno` int not null comment '所在部门编号', -primary key (`eno`), -constraint `fk_emp_mgr` foreign key (`mgr`) references tb_emp (`eno`), -constraint `fk_emp_dno` foreign key (`dno`) references tb_dept (`dno`) -); - --- 插入14个员工 -insert into `tb_emp` values - (7800, '张三丰', '总裁', null, 9000, 1200, 20), - (2056, '乔峰', '分析师', 7800, 5000, 1500, 20), - (3088, '李莫愁', '设计师', 2056, 3500, 800, 20), - (3211, '张无忌', '程序员', 2056, 3200, null, 20), - (3233, '丘处机', '程序员', 2056, 3400, null, 20), - (3251, '张翠山', '程序员', 2056, 4000, null, 20), - (5566, '宋远桥', '会计师', 7800, 4000, 1000, 10), - (5234, '郭靖', '出纳', 5566, 2000, null, 10), - (3344, '黄蓉', '销售主管', 7800, 3000, 800, 30), - (1359, '胡一刀', '销售员', 3344, 1800, 200, 30), - (4466, '苗人凤', '销售员', 3344, 2500, null, 30), - (3244, '欧阳锋', '程序员', 3088, 3200, null, 20), - (3577, '杨过', '会计', 5566, 2200, null, 10), - (3588, '朱九真', '会计', 5566, 2500, null, 10); -``` - -例子1:查询按月薪从高到低排在第4到第6名的员工的姓名和月薪。 - -```SQL -select * from ( - select - `ename`, `sal`, - row_number() over (order by `sal` desc) as `rank` - from `tb_emp` -) `temp` where `rank` between 4 and 6; -``` - -> **说明**:上面使用的函数`row_number()`可以为每条记录生成一个行号,在实际工作中可以根据需要将其替换为`rank()`或`dense_rank()`函数,三者的区别可以参考官方文档或阅读[《通俗易懂的学会:SQL窗口函数》](https://zhuanlan.zhihu.com/p/92654574)进行了解。在MySQL 8以前的版本,我们可以通过下面的方式来完成类似的操作。 -> -> ```SQL -> select `rank`, `ename`, `sal` from ( -> select @a:=@a+1 as `rank`, `ename`, `sal` -> from `tb_emp`, (select @a:=0) as t1 order by `sal` desc -> ) t2 where `rank` between 4 and 6; -> ``` - -例子2:查询每个部门月薪最高的两名的员工的姓名和部门名称。 - -```SQL -select `ename`, `sal`, `dname` -from ( - select - `ename`, `sal`, `dno`, - rank() over (partition by `dno` order by `sal` desc) as `rank` - from `tb_emp` -) as `temp` natural join `tb_dept` where `rank`<=2; -``` - -> 说明:在MySQL 8以前的版本,我们可以通过下面的方式来完成类似的操作。 -> -> ```SQL -> select `ename`, `sal`, `dname` from `tb_emp` as `t1` -natural join `tb_dept` -where ( - select count(*) from `tb_emp` as `t2` - where `t1`.`dno`=`t2`.`dno` and `t2`.`sal`>`t1`.`sal` -)<2 order by `dno` asc, `sal` desc; -> ``` - -### 其他内容 - -#### 范式理论 - -范式理论是设计关系型数据库中二维表的指导思想。 - -1. 第一范式:数据表的每个列的值域都是由原子值组成的,不能够再分割。 -2. 第二范式:数据表里的所有数据都要和该数据表的键(主键与候选键)有完全依赖关系。 -3. 第三范式:所有非键属性都只和候选键有相关性,也就是说非键属性之间应该是独立无关的。 - -> **说明**:实际工作中,出于效率的考虑,我们在设计表时很有可能做出反范式设计,即故意降低方式级别,增加冗余数据来获得更好的操作性能。 - -#### 数据完整性 - -1. 实体完整性 - 每个实体都是独一无二的 - - - 主键(`primary key`) / 唯一约束(`unique`) -2. 引用完整性(参照完整性)- 关系中不允许引用不存在的实体 - - - 外键(`foreign key`) -3. 域(domain)完整性 - 数据是有效的 - - 数据类型及长度 - - - 非空约束(`not null`) - - - 默认值约束(`default`) - - - 检查约束(`check`) - - > **说明**:在 MySQL 8.x 以前,检查约束并不起作用。 - -#### 数据一致性 - -1. 事务:一系列对数据库进行读/写的操作,这些操作要么全都成功,要么全都失败。 - -2. 事务的 ACID 特性 - - 原子性:事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行 - - 一致性:事务应确保数据库的状态从一个一致状态转变为另一个一致状态 - - 隔离性:多个事务并发执行时,一个事务的执行不应影响其他事务的执行 - - 持久性:已被提交的事务对数据库的修改应该永久保存在数据库中 - -3. MySQL 中的事务操作 - - - 开启事务环境 - - ```SQL - start transaction - ``` - - - 提交事务 - - ```SQL - commit - ``` - - - 回滚事务 - - ```SQL - rollback - ``` - -4. 查看事务隔离级别 - - ```SQL - show variables like 'transaction_isolation'; - ``` - - ``` - +-----------------------+-----------------+ - | Variable_name | Value | - +-----------------------+-----------------+ - | transaction_isolation | REPEATABLE-READ | - +-----------------------+-----------------+ - ``` - - 可以看出,MySQL 默认的事务隔离级别是`REPEATABLE-READ`。 - -5. 修改(当前会话)事务隔离级别 - - ```SQL - set session transaction isolation level read committed; - ``` - - 重新查看事务隔离级别,结果如下所示。 - - ``` - +-----------------------+----------------+ - | Variable_name | Value | - +-----------------------+----------------+ - | transaction_isolation | READ-COMMITTED | - +-----------------------+----------------+ - ``` - -关系型数据库的事务是一个很大的话题,因为当存在多个并发事务访问数据时,就有可能出现三类读数据的问题(脏读、不可重复读、幻读)和两类更新数据的问题(第一类丢失更新、第二类丢失更新)。想了解这五类问题的,可以阅读我发布在 CSDN 网站上的[《Java面试题全集(上)》](https://blog.csdn.net/jackfrued/article/details/44921941)一文的第80题。为了避免这些问题,关系型数据库底层是有对应的锁机制的,按锁定对象不同可以分为表级锁和行级锁,按并发事务锁定关系可以分为共享锁和独占锁。然而直接使用锁是非常麻烦的,为此数据库为用户提供了自动锁机制,只要用户指定适当的事务隔离级别,数据库就会通过分析 SQL 语句,然后为事务访问的资源加上合适的锁。此外,数据库还会维护这些锁通过各种手段提高系统的性能,这些对用户来说都是透明的。想了解 MySQL 事务和锁的细节知识,推荐大家阅读进阶读物[《高性能MySQL》](https://item.jd.com/11220393.html),这也是数据库方面的经典书籍。 - -ANSI/ISO SQL 92标准定义了4个等级的事务隔离级别,如下表所示。需要说明的是,事务隔离级别和数据访问的并发性是对立的,事务隔离级别越高并发性就越差。所以要根据具体的应用来确定到底使用哪种事务隔离级别,这个地方没有万能的原则。 - - - -### 总结 - -关于 SQL 和 MySQL 的知识肯定远远不止上面列出的这些,比如 SQL 本身的优化、MySQL 性能调优、MySQL 运维相关工具、MySQL 数据的备份和恢复、监控 MySQL 服务、部署高可用架构等,这一系列的问题在这里都没有办法逐一展开来讨论,那就留到有需要的时候再进行讲解吧,各位读者也可以自行探索。 diff --git a/Day36-40/38.深入MySQL.md b/Day36-40/38.深入MySQL.md deleted file mode 100755 index da2ef49..0000000 --- a/Day36-40/38.深入MySQL.md +++ /dev/null @@ -1,661 +0,0 @@ -## 深入MySQL - -### 索引 - -索引是关系型数据库中用来提升查询性能最为重要的手段。关系型数据库中的索引就像一本书的目录,我们可以想象一下,如果要从一本书中找出某个知识点,但是这本书没有目录,这将是意见多么可怕的事情!我们估计得一篇一篇的翻下去,才能确定这个知识点到底在什么位置。创建索引虽然会带来存储空间上的开销,就像一本书的目录会占用一部分篇幅一样,但是在牺牲空间后换来的查询时间的减少也是非常显著的。 - -MySQL 数据库中所有数据类型的列都可以被索引。对于MySQL 8.0 版本的 InnoDB 存储引擎来说,它支持三种类型的索引,分别是 B+ 树索引、全文索引和 R 树索引。这里,我们只介绍使用得最为广泛的 B+ 树索引。使用 B+ 树的原因非常简单,因为它是目前在基于磁盘进行海量数据存储和排序上最有效率的数据结构。B+ 树是一棵[平衡树](https://zh.wikipedia.org/zh-cn/%E5%B9%B3%E8%A1%A1%E6%A0%91),树的高度通常为3或4,但是却可以保存从百万级到十亿级的数据,而从这些数据里面查询一条数据,只需要3次或4次 I/O 操作。 - -B+ 树由根节点、中间节点和叶子节点构成,其中叶子节点用来保存排序后的数据。由于记录在索引上是排序过的,因此在一个叶子节点内查找数据时可以使用二分查找,这种查找方式效率非常的高。当数据很少的时候,B+ 树只有一个根节点,数据也就保存在根节点上。随着记录越来越多,B+ 树会发生分裂,根节点不再保存数据,而是提供了访问下一层节点的指针,帮助快速确定数据在哪个叶子节点上。 - -在创建二维表时,我们通常都会为表指定主键列,主键列上默认会创建索引,而对于 MySQL InnoDB 存储引擎来说,因为它使用的是索引组织表这种数据存储结构,所以主键上的索引就是整张表的数据,而这种索引我们也将其称之为**聚集索引**(clustered index)。很显然,一张表只能有一个聚集索引,否则表的数据岂不是要保存多次。我们自己创建的索引都是二级索引(secondary index),更常见的叫法是**非聚集索引**(non-clustered index)。通过我们自定义的非聚集索引只能定位记录的主键,在获取数据时可能需要再通过主键上的聚集索引进行查询,这种现象称为“回表”,因此通过非聚集索引检索数据通常比使用聚集索引检索数据要慢。 - -接下来我们通过一个简单的例子来说明索引的意义,比如我们要根据学生的姓名来查找学生,这个场景在实际开发中应该经常遇到,就跟通过商品名称查找商品是一个道理。我们可以使用 MySQL 的`explain`关键字来查看 SQL 的执行计划(数据库执行 SQL 语句的具体步骤)。 - -```SQL -explain select * from tb_student where stuname='林震南'\G -``` - -``` -*************************** 1. row *************************** - id: 1 - select_type: SIMPLE - table: tb_student - partitions: NULL - type: ALL -possible_keys: NULL - key: NULL - key_len: NULL - ref: NULL - rows: 11 - filtered: 10.00 - Extra: Using where -1 row in set, 1 warning (0.00 sec) -``` - -在上面的 SQL 执行计划中,有几项值得我们关注: - -1. `select_type`:查询的类型。 - - `SIMPLE`:简单 SELECT,不需要使用 UNION 操作或子查询。 - - `PRIMARY`:如果查询包含子查询,最外层的 SELECT 被标记为 PRIMARY。 - - `UNION`:UNION 操作中第二个或后面的 SELECT 语句。 - - `SUBQUERY`:子查询中的第一个 SELECT。 - - `DERIVED`:派生表的 SELECT 子查询。 -2. `table`:查询对应的表。 -3. `type`:MySQL 在表中找到满足条件的行的方式,也称为访问类型,包括:`ALL`(全表扫描)、`index`(索引全扫描,只遍历索引树)、`range`(索引范围扫描)、`ref`(非唯一索引扫描)、`eq_ref`(唯一索引扫描)、`const` / `system`(常量级查询)、`NULL`(不需要访问表或索引)。在所有的访问类型中,很显然 ALL 是性能最差的,它代表的全表扫描是指要扫描表中的每一行才能找到匹配的行。 -4. `possible_keys`:MySQL 可以选择的索引,但是**有可能不会使用**。 -5. `key`:MySQL 真正使用的索引,如果为`NULL`就表示没有使用索引。 -6. `key_len`:使用的索引的长度,在不影响查询的情况下肯定是长度越短越好。 -7. `rows`:执行查询需要扫描的行数,这是一个**预估值**。 -8. `extra`:关于查询额外的信息。 - - `Using filesort`:MySQL 无法利用索引完成排序操作。 - - `Using index`:只使用索引的信息而不需要进一步查表来获取更多的信息。 - - `Using temporary`:MySQL 需要使用临时表来存储结果集,常用于分组和排序。 - - `Impossible where`:`where`子句会导致没有符合条件的行。 - - `Distinct`:MySQL 发现第一个匹配行后,停止为当前的行组合搜索更多的行。 - - `Using where`:查询的列未被索引覆盖,筛选条件并不是索引的前导列。 - -从上面的执行计划可以看出,当我们通过学生名字查询学生时实际上是进行了全表扫描,不言而喻这个查询性能肯定是非常糟糕的,尤其是在表中的行很多的时候。如果我们需要经常通过学生姓名来查询学生,那么就应该在学生姓名对应的列上创建索引,通过索引来加速查询。 - -```SQL -create index idx_student_name on tb_student(stuname); -``` - -再次查看刚才的 SQL 对应的执行计划。 - -```SQL -explain select * from tb_student where stuname='林震南'\G -``` - -``` -*************************** 1. row *************************** - id: 1 - select_type: SIMPLE - table: tb_student - partitions: NULL - type: ref -possible_keys: idx_student_name - key: idx_student_name - key_len: 62 - ref: const - rows: 1 - filtered: 100.00 - Extra: NULL -1 row in set, 1 warning (0.00 sec) -``` - -可以注意到,在对学生姓名创建索引后,刚才的查询已经不是全表扫描而是基于索引的查询,而且扫描的行只有唯一的一行,这显然大大的提升了查询的性能。MySQL 中还允许创建前缀索引,即对索引字段的前N个字符创建索引,这样的话可以减少索引占用的空间(但节省了空间很有可能会浪费时间,**时间和空间是不可调和的矛盾**),如下所示。 - -```SQL -create index idx_student_name_1 on tb_student(stuname(1)); -``` - -上面的索引相当于是根据学生姓名的第一个字来创建的索引,我们再看看 SQL 执行计划。 - -```SQL -explain select * from tb_student where stuname='林震南'\G -``` - -``` -*************************** 1. row *************************** - id: 1 - select_type: SIMPLE - table: tb_student - partitions: NULL - type: ref -possible_keys: idx_student_name - key: idx_student_name - key_len: 5 - ref: const - rows: 2 - filtered: 100.00 - Extra: Using where -1 row in set, 1 warning (0.00 sec) -``` - -不知道大家是否注意到,这一次扫描的行变成了2行,因为学生表中有两个姓“林”的学生,我们只用姓名的第一个字作为索引的话,在查询时通过索引就会找到这两行。 - -如果要删除索引,可以使用下面的SQL。 - -```SQL -alter table tb_student drop index idx_student_name; -``` - -或者 - -```SQL -drop index idx_student_name on tb_student; -``` - -在创建索引时,我们还可以使用复合索引、函数索引(MySQL 5.7 开始支持),用好复合索引实现**索引覆盖**可以减少不必要的排序和回表操作,这样就会让查询的性能成倍的提升,有兴趣的读者可以自行研究。 - -我们简单的为大家总结一下索引的设计原则: - -1. **最适合**索引的列是出现在**WHERE子句**和连接子句中的列。 -2. 索引列的基数越大(取值多、重复值少),索引的效果就越好。 -3. 使用**前缀索引**可以减少索引占用的空间,内存中可以缓存更多的索引。 -4. **索引不是越多越好**,虽然索引加速了读操作(查询),但是写操作(增、删、改)都会变得更慢,因为数据的变化会导致索引的更新,就如同书籍章节的增删需要更新目录一样。 -5. 使用 InnoDB 存储引擎时,表的普通索引都会保存主键的值,所以**主键要尽可能选择较短的数据类型**,这样可以有效的减少索引占用的空间,提升索引的缓存效果。 - -最后,还有一点需要说明,InnoDB 使用的 B-tree 索引,数值类型的列除了等值判断时索引会生效之外,使用`>`、`<`、`>=`、`<=`、`BETWEEN...AND... `、`<>`时,索引仍然生效;对于字符串类型的列,如果使用不以通配符开头的模糊查询,索引也是起作用的,但是其他的情况会导致索引失效,这就意味着很有可能会做全表查询。 - -### 视图 - -视图是关系型数据库中将一组查询指令构成的结果集组合成可查询的数据表的对象。简单的说,视图就是虚拟的表,但与数据表不同的是,数据表是一种实体结构,而视图是一种虚拟结构,你也可以将视图理解为保存在数据库中被赋予名字的 SQL 语句。 - -使用视图可以获得以下好处: - -1. 可以将实体数据表隐藏起来,让外部程序无法得知实际的数据结构,让访问者可以使用表的组成部分而不是整个表,降低数据库被攻击的风险。 -2. 在大多数的情况下视图是只读的(更新视图的操作通常都有诸多的限制),外部程序无法直接透过视图修改数据。 -3. 重用 SQL 语句,将高度复杂的查询包装在视图表中,直接访问该视图即可取出需要的数据;也可以将视图视为数据表进行连接查询。 -4. 视图可以返回与实体数据表不同格式的数据,在创建视图的时候可以对数据进行格式化处理。 - -创建视图。 - -```SQL --- 创建视图 -create view `vw_avg_score` -as - select `stu_id`, round(avg(`score`), 1) as `avg_score` - from `tb_record` group by `stu_id`; - --- 基于已有的视图创建视图 -create view `vw_student_score` -as - select `stu_name`, `avg_score` - from `tb_student` natural join `vw_avg_score`; -``` - -> **提示**:因为视图不包含数据,所以每次使用视图时,都必须执行查询以获得数据,如果你使用了连接查询、嵌套查询创建了较为复杂的视图,你可能会发现查询性能下降得很厉害。因此,在使用复杂的视图前,应该进行测试以确保其性能能够满足应用的需求。 - -使用视图。 - -```SQL -select * from `vw_student_score` order by `avg_score` desc; -``` - -``` -+--------------+----------+ -| stuname | avgscore | -+--------------+----------+ -| 杨过 | 95.6 | -| 任我行 | 53.5 | -| 王语嫣 | 84.3 | -| 纪嫣然 | 73.8 | -| 岳不群 | 78.0 | -| 东方不败 | 88.0 | -| 项少龙 | 92.0 | -+--------------+----------+ -``` - -既然视图是一张虚拟的表,那么视图的中的数据可以更新吗?视图的可更新性要视具体情况而定,以下类型的视图是不能更新的: - -1. 使用了聚合函数(`SUM`、`MIN`、`MAX`、`AVG`、`COUNT`等)、`DISTINCT`、`GROUP BY`、`HAVING`、`UNION`或者`UNION ALL`的视图。 -2. `SELECT`中包含了子查询的视图。 -3. `FROM`子句中包含了一个不能更新的视图的视图。 -4. `WHERE`子句的子查询引用了`FROM`子句中的表的视图。 - -删除视图。 - -```SQL -drop view vw_student_score; -``` - -> **说明**:如果希望更新视图,可以先用上面的命令删除视图,也可以通过`create or replace view`来更新视图。 - -视图的规则和限制。 - -1. 视图可以嵌套,可以利用从其他视图中检索的数据来构造一个新的视图。视图也可以和表一起使用。 -2. 创建视图时可以使用`order by`子句,但如果从视图中检索数据时也使用了`order by`,那么该视图中原先的`order by`会被覆盖。 -3. 视图无法使用索引,也不会激发触发器(实际开发中因为性能等各方面的考虑,通常不建议使用触发器,所以我们也不对这个概念进行介绍)的执行。 - -### 函数 - -MySQL 中的函数跟 Python 中的函数太多的差异,因为函数都是用来封装功能上相对独立且会被重复使用的代码的。如果非要找出一些差别来,那么 MySQL 中的函数是可以执行 SQL 语句的。下面的例子,我们通过自定义函数实现了截断超长字符串的功能。 - -```SQL -delimiter $$ - -create function truncate_string( - content varchar(10000), - max_length int unsigned -) returns varchar(10000) no sql -begin - declare result varchar(10000) default content; - if char_length(content) > max_length then - set result = left(content, max_length); - set result = concat(result, '……'); - end if; - return result; -end $$ - -delimiter ; -``` - -> **说明1**:函数声明后面的`no sql`是声明函数体并没有使用 SQL 语句;如果函数体中需要通过 SQL 读取数据,需要声明为`reads sql data`。 -> -> **说明2**:定义函数前后的`delimiter`命令是为了修改定界符,因为函数体中的语句都是用`;`表示结束,如果不重新定义定界符,那么遇到的`;`的时候代码就会被截断执行,显然这不是我们想要的效果。 - -在查询中调用自定义函数。 - -```SQL -select truncate_string('和我在成都的街头走一走,直到所有的灯都熄灭了也不停留', 10) as short_string; -``` - -``` -+--------------------------------------+ -| short_string | -+--------------------------------------+ -| 和我在成都的街头走一…… | -+--------------------------------------+ -``` - -### 过程 - -过程(又称存储过程)是事先编译好存储在数据库中的一组 SQL 的集合,调用过程可以简化应用程序开发人员的工作,减少与数据库服务器之间的通信,对于提升数据操作的性能也是有帮助的。其实迄今为止,我们使用的 SQL 语句都是针对一个或多个表的单条语句,但在实际开发中经常会遇到某个操作需要多条 SQL 语句才能完成的情况。例如,电商网站在受理用户订单时,需要做以下一系列的处理。 - -1. 通过查询来核对库存中是否有对应的物品以及库存是否充足。 -2. 如果库存有物品,需要锁定库存以确保这些物品不再卖给别人, 并且要减少可用的物品数量以反映正确的库存量。 -3. 如果库存不足,可能需要进一步与供应商进行交互或者至少产生一条系统提示消息。 -4. 不管受理订单是否成功,都需要产生流水记录,而且需要给对应的用户产生一条通知信息。 - -我们可以通过过程将复杂的操作封装起来,这样不仅有助于保证数据的一致性,而且将来如果业务发生了变动,只需要调整和修改过程即可。对于调用过程的用户来说,过程并没有暴露数据表的细节,而且执行过程比一条条的执行一组 SQL 要快得多。 - -下面的过程实现了查询某门课程的最高分、最低分和平均分。 - -```SQL -drop procedure if exists sp_score_stat; - -delimiter $$ - -create procedure sp_score_stat( - courseId int, - out maxScore decimal(4,1), - out minScore decimal(4,1), - out avgScore decimal(4,1) -) -begin - select max(score) into maxScore from tb_record where cou_id=courseId; - select min(score) into minScore from tb_record where cou_id=courseId; - select avg(score) into avgScore from tb_record where cou_id=courseId; -end $$ - -delimiter ; -``` - -> **说明**:在定义过程时,因为可能需要书写多条 SQL,而分隔这些 SQL 需要使用分号作为分隔符,如果这个时候,仍然用分号表示整段代码结束,那么定义过程的 SQL 就会出现错误,所以上面我们用`delimiter $$`将整段代码结束的标记定义为`$$`,那么代码中的分号将不再表示整段代码的结束,整段代码只会在遇到`end $$`时才会执行。在定义完过程后,通过`delimiter ;`将结束符重新改回成分号(恢复现场)。 - -上面定义的过程有四个参数,其中第一个参数是输入参数,代表课程的编号,后面的参数都是输出参数,因为过程不能定义返回值,只能通过输出参数将执行结果带出,定义输出参数的关键字是`out`,默认情况下参数都是输入参数。 - -调用过程。 - -```SQL -call sp_score_stat(1111, @a, @b, @c); -``` - -获取输出参数的值。 - -```SQL -select @a as 最高分, @b as 最低分, @c as 平均分; -``` - -删除过程。 - -```SQL -drop procedure sp_score_stat; -``` - -在过程中,我们可以定义变量、条件,可以使用分支和循环语句,可以通过游标操作查询结果,还可以使用事件调度器,这些内容我们暂时不在此处进行介绍。虽然我们说了很多过程的好处,但是在实际开发中,如果频繁的使用过程并将大量复杂的运算放到过程中,会给据库服务器造成巨大的压力,而数据库往往都是性能瓶颈所在,使用过程无疑是雪上加霜的操作。所以,对于互联网产品开发,我们一般建议让数据库只做好存储,复杂的运算和处理交给应用服务器上的程序去完成,如果应用服务器变得不堪重负了,我们可以比较容易的部署多台应用服务器来分摊这些压力。 - -如果大家对上面讲到的视图、函数、过程包括我们没有讲到的触发器这些知识有兴趣,建议大家阅读 MySQL 的入门读物[《MySQL必知必会》](https://item.jd.com/12818982.html)进行一般性了解即可,因为这些知识点在大家将来的工作中未必用得上,学了也可能仅仅是为了应付面试而已。 - -### MySQL 新特性 - -#### JSON类型 - -很多开发者在使用关系型数据库做数据持久化的时候,常常感到结构化的存储缺乏灵活性,因为必须事先设计好所有的列以及对应的数据类型。在业务发展和变化的过程中,如果需要修改表结构,这绝对是比较麻烦和难受的事情。从 MySQL 5.7 版本开始,MySQL引入了对 JSON 数据类型的支持(MySQL 8.0 解决了 JSON 的日志性能瓶颈问题),用好 JSON 类型,其实就是打破了关系型数据库和非关系型数据库之间的界限,为数据持久化操作带来了更多的便捷。 - -JSON 类型主要分为 JSON 对象和 JSON数组两种,如下所示。 - -1. JSON 对象 - -```JSON -{"name": "骆昊", "tel": "13122335566", "QQ": "957658"} -``` - -2. JSON 数组 - -```JSON -[1, 2, 3] -``` - -```JSON -[{"name": "骆昊", "tel": "13122335566"}, {"name": "王大锤", "QQ": "123456"}] -``` - -哪些地方需要用到JSON类型呢?举一个简单的例子,现在很多产品的用户登录都支持多种方式,例如手机号、微信、QQ、新浪微博等,但是一般情况下我们又不会要求用户提供所有的这些信息,那么用传统的设计方式,就需要设计多个列来对应多种登录方式,可能还需要允许这些列存在空值,这显然不是很好的选择;另一方面,如果产品又增加了一种登录方式,那么就必然要修改之前的表结构,这就更让人痛苦了。但是,有了 JSON 类型,刚才的问题就迎刃而解了,我们可以做出如下所示的设计。 - -```SQL -create table `tb_test` -( -`user_id` bigint unsigned, -`login_info` json, -primary key (`user_id`) -) engine=innodb; - -insert into `tb_test` values - (1, '{"tel": "13122335566", "QQ": "654321", "wechat": "jackfrued"}'), - (2, '{"tel": "13599876543", "weibo": "wangdachui123"}'); -``` - -如果要查询用户的手机和微信号,可以用如下所示的 SQL 语句。 - -```SQL -select - `user_id`, - json_unquote(json_extract(`login_info`, '$.tel')) as 手机号, - json_unquote(json_extract(`login_info`, '$.wechat')) as 微信 -from `tb_test`; -``` - -``` -+---------+-------------+-----------+ -| user_id | 手机号 | 微信 | -+---------+-------------+-----------+ -| 1 | 13122335566 | jackfrued | -| 2 | 13599876543 | NULL | -+---------+-------------+-----------+ -``` - -因为支持 JSON 类型,MySQL 也提供了配套的处理 JSON 数据的函数,就像上面用到的`json_extract`和`json_unquote`。当然,上面的 SQL 还有更为便捷的写法,如下所示。 - -```SQL -select - `user_id`, - `login_info` ->> '$.tel' as 手机号, - `login_info` ->> '$.wechat' as 微信 -from `tb_test`; -``` - -再举个例子,如果我们的产品要实现用户画像功能(给用户打标签),然后基于用户画像给用户推荐平台的服务或消费品之类的东西,我们也可以使用 JSON 类型来保存用户画像数据,示意代码如下所示。 - -创建画像标签表。 - -```SQL -create table `tb_tags` -( -`tag_id` int unsigned not null comment '标签ID', -`tag_name` varchar(20) not null comment '标签名', -primary key (`tag_id`) -) engine=innodb; - -insert into `tb_tags` (`tag_id`, `tag_name`) -values - (1, '70后'), - (2, '80后'), - (3, '90后'), - (4, '00后'), - (5, '爱运动'), - (6, '高学历'), - (7, '小资'), - (8, '有房'), - (9, '有车'), - (10, '爱看电影'), - (11, '爱网购'), - (12, '常点外卖'); -``` - -为用户打标签。 - -```SQL -create table `tb_users_tags` -( -`user_id` bigint unsigned not null comment '用户ID', -`user_tags` json not null comment '用户标签' -) engine=innodb; - -insert into `tb_users_tags` values - (1, '[2, 6, 8, 10]'), - (2, '[3, 10, 12]'), - (3, '[3, 8, 9, 11]'); -``` - -接下来,我们通过一组查询来了解 JSON 类型的巧妙之处。 - -1. 查询爱看电影(有`10`这个标签)的用户ID。 - - ```SQL - select * from `tb_users` where 10 member of (user_tags->'$'); - ``` - -2. 查询爱看电影(有`10`这个标签)的80后(有`2`这个标签)用户ID。 - - ``` - select * from `tb_users` where json_contains(user_tags->'$', '[2, 10]'); - -3. 查询爱看电影或80后或90后的用户ID。 - - ```SQL - select `user_id` from `tb_users_tags` where json_overlaps(user_tags->'$', '[2, 3, 10]'); - ``` - -> **说明**:上面的查询用到了`member of`谓词和两个 JSON 函数,`json_contains`可以检查 JSON 数组是否包含了指定的元素,而`json_overlaps`可以检查 JSON 数组是否与指定的数组有重叠部分。 - -#### 窗口函数 - -MySQL 从8.0开始支持窗口函数,大多数商业数据库和一些开源数据库早已提供了对窗口函数的支持,有的也将其称之为 OLAP(联机分析和处理)函数,听名字就知道跟统计和分析相关。为了帮助大家理解窗口函数,我们先说说窗口的概念。 - -窗口可以理解为记录的集合,窗口函数也就是在满足某种条件的记录集合上执行的特殊函数,对于每条记录都要在此窗口内执行函数。窗口函数和我们上面讲到的聚合函数比较容易混淆,二者的区别主要在于聚合函数是将多条记录聚合为一条记录,窗口函数是每条记录都会执行,执行后记录条数不会变。窗口函数不仅仅是几个函数,它是一套完整的语法,函数只是该语法的一部分,基本语法如下所示: - -```SQL -<窗口函数> over (partition by <用于分组的列名> order by <用户排序的列名>) -``` - -上面语法中,窗口函数的位置可以放以下两种函数: - -1. 专用窗口函数,包括:`lead`、`lag`、`first_value`、`last_value`、`rank`、`dense_rank`和`row_number`等。 -2. 聚合函数,包括:`sum`、`avg`、`max`、`min`和`count`等。 - -下面为大家举几个使用窗口函数的简单例子,我们先用如下所示的 SQL 建库建表。 - -```SQL --- 创建名为hrs的数据库并指定默认的字符集 -create database `hrs` default charset utf8mb4; - --- 切换到hrs数据库 -use `hrs`; - --- 创建部门表 -create table `tb_dept` -( -`dno` int not null comment '编号', -`dname` varchar(10) not null comment '名称', -`dloc` varchar(20) not null comment '所在地', -primary key (`dno`) -); - --- 插入4个部门 -insert into `tb_dept` values - (10, '会计部', '北京'), - (20, '研发部', '成都'), - (30, '销售部', '重庆'), - (40, '运维部', '深圳'); - --- 创建员工表 -create table `tb_emp` -( -`eno` int not null comment '员工编号', -`ename` varchar(20) not null comment '员工姓名', -`job` varchar(20) not null comment '员工职位', -`mgr` int comment '主管编号', -`sal` int not null comment '员工月薪', -`comm` int comment '每月补贴', -`dno` int not null comment '所在部门编号', -primary key (`eno`), -constraint `fk_emp_mgr` foreign key (`mgr`) references tb_emp (`eno`), -constraint `fk_emp_dno` foreign key (`dno`) references tb_dept (`dno`) -); - --- 插入14个员工 -insert into `tb_emp` values - (7800, '张三丰', '总裁', null, 9000, 1200, 20), - (2056, '乔峰', '分析师', 7800, 5000, 1500, 20), - (3088, '李莫愁', '设计师', 2056, 3500, 800, 20), - (3211, '张无忌', '程序员', 2056, 3200, null, 20), - (3233, '丘处机', '程序员', 2056, 3400, null, 20), - (3251, '张翠山', '程序员', 2056, 4000, null, 20), - (5566, '宋远桥', '会计师', 7800, 4000, 1000, 10), - (5234, '郭靖', '出纳', 5566, 2000, null, 10), - (3344, '黄蓉', '销售主管', 7800, 3000, 800, 30), - (1359, '胡一刀', '销售员', 3344, 1800, 200, 30), - (4466, '苗人凤', '销售员', 3344, 2500, null, 30), - (3244, '欧阳锋', '程序员', 3088, 3200, null, 20), - (3577, '杨过', '会计', 5566, 2200, null, 10), - (3588, '朱九真', '会计', 5566, 2500, null, 10); -``` - -例子1:查询按月薪从高到低排在第4到第6名的员工的姓名和月薪。 - -```SQL -select * from ( - select - `ename`, `sal`, - row_number() over (order by `sal` desc) as `rank` - from `tb_emp` -) `temp` where `rank` between 4 and 6; -``` - -> **说明**:上面使用的函数`row_number()`可以为每条记录生成一个行号,在实际工作中可以根据需要将其替换为`rank()`或`dense_rank()`函数,三者的区别可以参考官方文档或阅读[《通俗易懂的学会:SQL窗口函数》](https://zhuanlan.zhihu.com/p/92654574)进行了解。在MySQL 8以前的版本,我们可以通过下面的方式来完成类似的操作。 -> -> ```SQL -> select `rank`, `ename`, `sal` from ( -> select @a:=@a+1 as `rank`, `ename`, `sal` -> from `tb_emp`, (select @a:=0) as t1 order by `sal` desc -> ) t2 where `rank` between 4 and 6; -> ``` - -例子2:查询每个部门月薪最高的两名的员工的姓名和部门名称。 - -```SQL -select `ename`, `sal`, `dname` -from ( - select - `ename`, `sal`, `dno`, - rank() over (partition by `dno` order by `sal` desc) as `rank` - from `tb_emp` -) as `temp` natural join `tb_dept` where `rank`<=2; -``` - -> 说明:在MySQL 8以前的版本,我们可以通过下面的方式来完成类似的操作。 -> -> ```SQL -> select `ename`, `sal`, `dname` from `tb_emp` as `t1` -natural join `tb_dept` -where ( - select count(*) from `tb_emp` as `t2` - where `t1`.`dno`=`t2`.`dno` and `t2`.`sal`>`t1`.`sal` -)<2 order by `dno` asc, `sal` desc; -> ``` - -### 其他内容 - -#### 范式理论 - -范式理论是设计关系型数据库中二维表的指导思想。 - -1. 第一范式:数据表的每个列的值域都是由原子值组成的,不能够再分割。 -2. 第二范式:数据表里的所有数据都要和该数据表的键(主键与候选键)有完全依赖关系。 -3. 第三范式:所有非键属性都只和候选键有相关性,也就是说非键属性之间应该是独立无关的。 - -> **说明**:实际工作中,出于效率的考虑,我们在设计表时很有可能做出反范式设计,即故意降低方式级别,增加冗余数据来获得更好的操作性能。 - -#### 数据完整性 - -1. 实体完整性 - 每个实体都是独一无二的 - - - 主键(`primary key`) / 唯一约束(`unique`) -2. 引用完整性(参照完整性)- 关系中不允许引用不存在的实体 - - - 外键(`foreign key`) -3. 域(domain)完整性 - 数据是有效的 - - 数据类型及长度 - - - 非空约束(`not null`) - - - 默认值约束(`default`) - - - 检查约束(`check`) - - > **说明**:在 MySQL 8.x 以前,检查约束并不起作用。 - -#### 数据一致性 - -1. 事务:一系列对数据库进行读/写的操作,这些操作要么全都成功,要么全都失败。 - -2. 事务的 ACID 特性 - - 原子性:事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行 - - 一致性:事务应确保数据库的状态从一个一致状态转变为另一个一致状态 - - 隔离性:多个事务并发执行时,一个事务的执行不应影响其他事务的执行 - - 持久性:已被提交的事务对数据库的修改应该永久保存在数据库中 - -3. MySQL 中的事务操作 - - - 开启事务环境 - - ```SQL - start transaction - ``` - - - 提交事务 - - ```SQL - commit - ``` - - - 回滚事务 - - ```SQL - rollback - ``` - -4. 查看事务隔离级别 - - ```SQL - show variables like 'transaction_isolation'; - ``` - - ``` - +-----------------------+-----------------+ - | Variable_name | Value | - +-----------------------+-----------------+ - | transaction_isolation | REPEATABLE-READ | - +-----------------------+-----------------+ - ``` - - 可以看出,MySQL 默认的事务隔离级别是`REPEATABLE-READ`。 - -5. 修改(当前会话)事务隔离级别 - - ```SQL - set session transaction isolation level read committed; - ``` - - 重新查看事务隔离级别,结果如下所示。 - - ``` - +-----------------------+----------------+ - | Variable_name | Value | - +-----------------------+----------------+ - | transaction_isolation | READ-COMMITTED | - +-----------------------+----------------+ - ``` - -关系型数据库的事务是一个很大的话题,因为当存在多个并发事务访问数据时,就有可能出现三类读数据的问题(脏读、不可重复读、幻读)和两类更新数据的问题(第一类丢失更新、第二类丢失更新)。想了解这五类问题的,可以阅读我发布在 CSDN 网站上的[《Java面试题全集(上)》](https://blog.csdn.net/jackfrued/article/details/44921941)一文的第80题。为了避免这些问题,关系型数据库底层是有对应的锁机制的,按锁定对象不同可以分为表级锁和行级锁,按并发事务锁定关系可以分为共享锁和独占锁。然而直接使用锁是非常麻烦的,为此数据库为用户提供了自动锁机制,只要用户指定适当的事务隔离级别,数据库就会通过分析 SQL 语句,然后为事务访问的资源加上合适的锁。此外,数据库还会维护这些锁通过各种手段提高系统的性能,这些对用户来说都是透明的。想了解 MySQL 事务和锁的细节知识,推荐大家阅读进阶读物[《高性能MySQL》](https://item.jd.com/11220393.html),这也是数据库方面的经典书籍。 - -ANSI/ISO SQL 92标准定义了4个等级的事务隔离级别,如下表所示。需要说明的是,事务隔离级别和数据访问的并发性是对立的,事务隔离级别越高并发性就越差。所以要根据具体的应用来确定到底使用哪种事务隔离级别,这个地方没有万能的原则。 - - - -### 总结 - -关于 SQL 和 MySQL 的知识肯定远远不止上面列出的这些,比如 SQL 本身的优化、MySQL 性能调优、MySQL 运维相关工具、MySQL 数据的备份和恢复、监控 MySQL 服务、部署高可用架构等,这一系列的问题在这里都没有办法逐一展开来讨论,那就留到有需要的时候再进行讲解吧,各位读者也可以自行探索。 diff --git a/Day36-40/40.大数据平台和HiveSQL.md b/Day36-40/40.大数据平台和HiveSQL.md deleted file mode 100755 index de6fdc1..0000000 --- a/Day36-40/40.大数据平台和HiveSQL.md +++ /dev/null @@ -1,213 +0,0 @@ -## Hive简介 - -Hive是Facebook开源的一款基于Hadoop的数据仓库工具,是目前应用最广泛的大数据处理解决方案,它能将SQL查询转变为 MapReduce(Google提出的一个软件架构,用于大规模数据集的并行运算)任务,对SQL提供了完美的支持,能够非常方便的实现大数据统计。 - - - -> **说明**:可以通过来了解Hadoop生态圈。 - -如果要简单的介绍Hive,那么以下两点是其核心: - -1. 把HDFS中结构化的数据映射成表。 -2. 通过把Hive-SQL进行解析和转换,最终生成一系列基于Hadoop的MapReduce任务/Spark任务,通过执行这些任务完成对数据的处理。也就是说,即便不学习Java、Scala这样的编程语言,一样可以实现对数据的处理。 - -Hive和传统关系型数据库的对比如下表所示。 - -| | Hive | RDBMS | -| -------- | ----------------- | ------------ | -| 查询语言 | HQL | SQL | -| 存储数据 | HDFS | 本地文件系统 | -| 执行方式 | MapReduce / Spark | Executor | -| 执行延迟 | 高 | 低 | -| 数据规模 | 大 | 小 | - -### 准备工作 - -1. 搭建如下图所示的大数据平台。 - - ![bigdata-basic-env](https://gitee.com/jackfrued/mypic/raw/master/20220210080638.png) - -2. 通过Client节点访问大数据平台。 - - ![bigdata-vpc](https://gitee.com/jackfrued/mypic/raw/master/20220210080655.png) - -3. 创建文件Hadoop的文件系统。 - - ```Shell - hadoop fs -mkdir /data - hadoop fs -chmod g+w /data - ``` - -4. 将准备好的数据文件拷贝到Hadoop文件系统中。 - - ```Shell - hadoop fs -put /home/ubuntu/data/* /data - ``` - -### 创建/删除数据库 - -创建。 - -```SQL -create database if not exists demo; -``` - -或 - -```Shell -hive -e "create database demo;" -``` - -删除。 - -```SQL -drop database if exists demo; -``` - -切换。 - -```SQL -use demo; -``` - -### 数据类型 - -Hive的数据类型如下所示。 - -基本数据类型。 - -| 数据类型 | 占用空间 | 支持版本 | -| --------- | -------- | -------- | -| tinyint | 1-Byte | | -| smallint | 2-Byte | | -| int | 4-Byte | | -| bigint | 8-Byte | | -| boolean | | | -| float | 4-Byte | | -| double | 8-Byte | | -| string | | | -| binary | | 0.8版本 | -| timestamp | | 0.8版本 | -| decimal | | 0.11版本 | -| char | | 0.13版本 | -| varchar | | 0.12版本 | -| date | | 0.12版本 | - -复杂数据类型。 - -| 数据类型 | 描述 | 例子 | -| -------- | ------------------------ | --------------------------------------------- | -| struct | 和C语言中的结构体类似 | `struct` | -| map | 由键值对构成的元素的集合 | `map` | -| array | 具有相同类型的变量的容器 | `array` | - -### 创建和使用表 - -1. 创建内部表。 - - ```SQL - create table if not exists user_info - ( - user_id string, - user_name string, - sex string, - age int, - city string, - firstactivetime string, - level int, - extra1 string, - extra2 map - ) - row format delimited fields terminated by '\t' - collection items terminated by ',' - map keys terminated by ':' - lines terminated by '\n' - stored as textfile; - ``` - -2. 加载数据。 - - ```SQL - load data local inpath '/home/ubuntu/data/user_info/user_info.txt' overwrite into table user_info; - ``` - - 或 - - ```SQL - load data inpath '/data/user_info/user_info.txt' overwrite into table user_info; - ``` - -3. 创建分区表。 - - ```SQL - create table if not exists user_trade - ( - user_name string, - piece int, - price double, - pay_amount double, - goods_category string, - pay_time bigint - ) - partitioned by (dt string) - row format delimited fields terminated by '\t'; - ``` - -4. 设置动态分区。 - - ```SQL - set hive.exec.dynamic.partition=true; - set hive.exec.dynamic.partition.mode=nonstrict; - set hive.exec.max.dynamic.partitions=10000; - set hive.exec.max.dynamic.partitions.pernode=10000; - ``` - -5. 拷贝数据(Shell命令)。 - - ```Shell - hdfs dfs -put /home/ubuntu/data/user_trade/* /user/hive/warehouse/demo.db/user_trade - ``` - -6. 修复分区表。 - - ```SQL - msck repair table user_trade; - ``` - -### 查询 - -#### 基本语法 - -```SQL -select user_name from user_info where city='beijing' and sex='female' limit 10; -select user_name, piece, pay_amount from user_trade where dt='2019-03-24' and goods_category='food'; -``` - -#### group by - -```SQL --- 查询2019年1月到4月,每个品类有多少人购买,累计金额是多少 -select goods_category, count(distinct user_name) as user_num, sum(pay_amount) as total from user_trade where dt between '2019-01-01' and '2019-04-30' group by goods_category; -``` - -```SQL --- 查询2019年4月支付金额超过5万元的用户 -select user_name, sum(pay_amount) as total from user_trade where dt between '2019-04-01' and '2019-04-30' group by user_name having sum(pay_amount) > 50000; -``` - -#### order by - -```SQL --- 查询2019年4月支付金额最多的用户前5名 -select user_name, sum(pay_amount) as total from user_trade where dt between '2019-04-01' and '2019-04-30' group by user_name order by total desc limit 5; -``` - -#### 常用函数 - -1. `from_unixtime`:将时间戳转换成日期 -2. `unix_timestamp`:将日期转换成时间戳 -3. `datediff`:计算两个日期的时间差 -4. `if`:根据条件返回不同的值 -5. `substr`:字符串取子串 -6. `get_json_object`:从JSON字符串中取出指定的`key`对应的`value`,如:`get_json_object(info, '$.first_name')`。 - diff --git a/Day36-40/NoSQL数据库入门.md b/Day36-40/NoSQL数据库入门.md deleted file mode 100755 index 827c13f..0000000 --- a/Day36-40/NoSQL数据库入门.md +++ /dev/null @@ -1,582 +0,0 @@ -## NoSQL入门 - -### NoSQL概述 - -如今,大多数的计算机系统(包括服务器、PC、移动设备等)都会产生庞大的数据量。其实,早在2012年的时候,全世界每天产生的数据量就达到了2.5EB(艾字节,$$1EB\approx10^{18}B$$)。这些数据有很大一部分是由关系型数据库来存储和管理的。 早在1970年,E.F.Codd发表了论述关系型数据库的著名论文“*A relational model of data for large shared data banks*”,这篇文章奠定了关系型数据库的基础并在接下来的数十年时间内产生了深远的影响。实践证明,关系型数据库是实现数据持久化最为重要的方式,它也是大多数应用在选择持久化方案时的首选技术。 - -NoSQL是一项全新的数据库革命性运动,虽然它的历史可以追溯到1998年,但是NoSQL真正深入人心并得到广泛的应用是在进入大数据时候以后,业界普遍认为NoSQL是更适合大数据存储的技术方案,这才使得NoSQL的发展达到了前所未有的高度。2012年《纽约时报》的一篇专栏中写到,大数据时代已经降临,在商业、经济及其他领域中,决策将不再基于经验和直觉而是基于数据和分析而作出。事实上,在天文学、气象学、基因组学、生物学、社会学、互联网搜索引擎、金融、医疗、社交网络、电子商务等诸多领域,由于数据过于密集和庞大,在数据的分析和处理上也遇到了前所未有的限制和阻碍,这一切都使得对大数据处理技术的研究被提升到了新的高度,也使得各种NoSQL的技术方案进入到了公众的视野。 - -NoSQL数据库按照其存储类型可以大致分为以下几类: - -| 类型 | 部分代表 | 特点 | -| ---------- | ----------------------------------- | ------------------------------------------------------------ | -| 列族数据库 | HBase
Cassandra
Hypertable | 顾名思义是按列存储数据的。最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的I/O优势,适合于批量数据处理和即时查询。 | -| 文档数据库 | MongoDB
CouchDB
ElasticSearch | 文档数据库一般用类JSON格式存储数据,存储的内容是文档型的。这样也就有机会对某些字段建立索引,实现关系数据库的某些功能,但不提供对参照完整性和分布事务的支持。 | -| KV数据库 | DynamoDB
Redis
LevelDB | 可以通过key快速查询到其value,有基于内存和基于磁盘两种实现方案。 | -| 图数据库 | Neo4J
FlockDB
JanusGraph | 使用图结构进行语义查询的数据库,它使用节点、边和属性来表示和存储数据。图数据库从设计上,就可以简单快速的检索难以在关系系统中建模的复杂层次结构。 | -| 对象数据库 | db4o
Versant | 通过类似面向对象语言的语法操作数据库,通过对象的方式存取数据。 | - -> **说明**:想了解更多的NoSQL数据库,可以访问。 - -### Redis概述 - -Redis是一种基于键值对的NoSQL数据库,它提供了对多种数据类型(字符串、哈希、列表、集合、有序集合、位图等)的支持,能够满足很多应用场景的需求。Redis将数据放在内存中,因此读写性能是非常惊人的。与此同时,Redis也提供了持久化机制,能够将内存中的数据保存到硬盘上,在发生意外状况时数据也不会丢掉。此外,Redis还支持键过期、地理信息运算、发布订阅、事务、管道、Lua脚本扩展等功能,总而言之,Redis的功能和性能都非常强大,如果项目中要实现高速缓存和消息队列这样的服务,直接交给Redis就可以了。目前,国内外很多著名的企业和商业项目都使用了Redis,包括:Twitter、Github、StackOverflow、新浪微博、百度、优酷土豆、美团、小米、唯品会等。 - - -#### Redis简介 - -2008年,一个名为Salvatore Sanfilippo的程序员为他开发的LLOOGG项目定制了专属的数据库(因为之前他无论怎样优化MySQL,系统性能已经无法再提升了),这项工作的成果就是Redis的初始版本。后来他将Redis的代码放到了全球最大的代码托管平台[Github](),从那以后,Redis引发了大量开发者的好评和关注,继而有数百人参与了Redis的开发和维护,这使得Redis的功能越来越强大和性能越来越好。 - -Redis是REmote DIctionary Server的缩写,它是一个用ANSI C编写的高性能的key-value存储系统,与其他的key-value存储系统相比,Redis有以下一些特点(也是优点): - -- Redis的读写性能极高,并且有丰富的特性(发布/订阅、事务、通知等)。 -- Redis支持数据的持久化(RDB和AOF两种方式),可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。 -- Redis支持多种数据类型,包括:string、hash、list、set,zset、bitmap、hyperloglog等。 -- Redis支持主从复制(实现读写分析)以及哨兵模式(监控master是否宕机并自动调整配置)。 -- Redis支持分布式集群,可以很容易的通过水平扩展来提升系统的整体性能。 -- Redis基于TCP提供的可靠传输服务进行通信,很多编程语言都提供了Redis客户端支持。 - -#### Redis的应用场景 - -1. 高速缓存 - 将不常变化但又经常被访问的热点数据放到Redis数据库中,可以大大降低关系型数据库的压力,从而提升系统的响应性能。 -2. 排行榜 - 很多网站都有排行榜功能,利用Redis中的列表和有序集合可以非常方便的构造各种排行榜系统。 -3. 商品秒杀/投票点赞 - Redis提供了对计数操作的支持,网站上常见的秒杀、点赞等功能都可以利用Redis的计数器通过+1或-1的操作来实现,从而避免了使用关系型数据的`update`操作。 -4. 分布式锁 - 利用Redis可以跨多台服务器实现分布式锁(类似于线程锁,但是能够被多台机器上的多个线程或进程共享)的功能,用于实现一个阻塞式操作。 -5. 消息队列 - 消息队列和高速缓存一样,是一个大型网站不可缺少的基础服务,可以实现业务解耦和非实时业务削峰等特性,这些我们都会在后面的项目中为大家展示。 - -#### Redis的安装和配置 - -可以使用Linux系统的包管理工具(如yum)来安装Redis,也可以通过在Redis的[官方网站](https://redis.io/)下载Redis的源代码,解压缩解归档之后通过make工具对源代码进行构建并安装,在更新这篇文档时,Redis官方提供的最新稳定版本是[Redis 5.0.10](https://download.redis.io/releases/redis-5.0.10.tar.gz)。 - -下载: - -```Bash -wget https://download.redis.io/releases/redis-5.0.10.tar.gz -``` - -解压缩和解归档: - -```Bash -tar -zxf redis-5.0.10.tar.gz -``` - -进入Redis源代码目录: - -```Bash -cd redis-5.0.10 -``` - -构建和安装: - -```Bash -make && make install -``` - -在redis源代码目录下有一个名为redis.conf的配置文件,我们可以先查看一下该文件。 - -```Bash -vim redis.conf -``` - -下面我们对Redis的配置文件进行一个扼要的介绍。 - -配置Redis服务的IP地址和端口: - -![](./res/redis-bind-and-port.png) - -配置底层有多少个数据库: - -![](./res/redis-databases.png) - -配置Redis的持久化机制 - RDB。 - -![](./res/redis-rdb-1.png) - -![](./res/redis-rdb-3.png) - -配置Redis的持久化机制 - AOF: - -![](./res/redis-aof.png) - -配置访问Redis服务器的口令: - -![](./res/redis-security.png) - -配置Redis的主从复制(通过主从复制可以实现读写分离): - -![](./res/redis-replication.png) - -配置慢查询: - -![](./res/redis-slow-logs.png) - -上面这些内容就是Redis的基本配置,如果你对上面的内容感到困惑也没有关系,先把Redis用起来再回头去推敲这些内容就行了。如果想找一些参考书,[《Redis开发与运维》](https://item.jd.com/12121730.html)是一本不错的入门读物,而[《Redis实战》](https://item.jd.com/11791607.html)是不错的进阶读物。 - -#### Redis的服务器和客户端 - -接下来启动Redis服务器,下面的方式将以默认的配置启动Redis服务。 - -```Bash -redis-server -``` - -如果希望修改Redis的配置(如端口、认证口令、持久化方式等),可以通过下面两种方式。 - -**方式一**:通过参数指定认证口令和AOF持久化方式。 - -```Bash -redis-server --requirepass yourpass --appendonly yes -``` - -**方式二**:通过指定的配置文件来修改Redis的配置。 - -```Bash -redis-server /root/redis-5.0.10/redis.conf -``` - -下面我们使用第一种方式来启动Redis并将其置于后台运行,将Redis产生的输出重定向到名为redis.log的文件中。 - -```Bash -redis-server --requirepass yourpass > redis.log & -``` - -可以通过`ps`或者`netstat`来检查Redis服务器是否启动成功。 - -```Bash -ps -ef | grep redis-server -netstat -nap | grep redis-server -``` - -接下来,我们尝试用Redis命令行工具`redis-cli`去连接服务器,该工具默认连接本机的`6379`端口,如果需要指定Redis服务器和端口,可以使用`-h`和`-p`参数分别进行指定。 - -```Bash -redis-cli -``` - -进入命令行工具后,就可以通过Redis的命令来操作Redis服务器,如下所示。 - -```Bash -127.0.0.1:6379> auth yourpass -OK -127.0.0.1:6379> ping -PONG -127.0.0.1:6379> -``` - -Redis有着非常丰富的数据类型,也有很多的命令来操作这些数据,具体的内容可以查看[Redis命令参考](http://redisdoc.com/),在这个网站上,除了Redis的命令参考,还有Redis的详细文档,其中包括了通知、事务、主从复制、持久化、哨兵、集群等内容。 - -![](./res/redis-data-types.png) - -> **说明**:上面的插图来自付磊和张益军编著的《Redis开发与运维》一书。 - -```Bash -127.0.0.1:6379> set username admin -OK -127.0.0.1:6379> get username -"admin" -127.0.0.1:6379> set password "123456" ex 300 -OK -127.0.0.1:6379> get password -"123456" -127.0.0.1:6379> ttl username -(integer) -1 -127.0.0.1:6379> ttl password -(integer) 286 -127.0.0.1:6379> hset stu1 name hao -(integer) 0 -127.0.0.1:6379> hset stu1 age 38 -(integer) 1 -127.0.0.1:6379> hset stu1 gender male -(integer) 1 -127.0.0.1:6379> hgetall stu1 -1) "name" -2) "hao" -3) "age" -4) "38" -5) "gender" -6) "male" -127.0.0.1:6379> hvals stu1 -1) "hao" -2) "38" -3) "male" -127.0.0.1:6379> hmset stu2 name wang age 18 gender female tel 13566778899 -OK -127.0.0.1:6379> hgetall stu2 -1) "name" -2) "wang" -3) "age" -4) "18" -5) "gender" -6) "female" -7) "tel" -8) "13566778899" -127.0.0.1:6379> lpush nums 1 2 3 4 5 -(integer) 5 -127.0.0.1:6379> lrange nums 0 -1 -1) "5" -2) "4" -3) "3" -4) "2" -5) "1" -127.0.0.1:6379> lpop nums -"5" -127.0.0.1:6379> lpop nums -"4" -127.0.0.1:6379> rpop nums -"1" -127.0.0.1:6379> rpop nums -"2" -127.0.0.1:6379> sadd fruits apple banana orange apple grape grape -(integer) 4 -127.0.0.1:6379> scard fruits -(integer) 4 -127.0.0.1:6379> smembers fruits -1) "grape" -2) "orange" -3) "banana" -4) "apple" -127.0.0.1:6379> sismember fruits apple -(integer) 1 -127.0.0.1:6379> sismember fruits durian -(integer) 0 -127.0.0.1:6379> sadd nums1 1 2 3 4 5 -(integer) 5 -127.0.0.1:6379> sadd nums2 2 4 6 8 -(integer) 4 -127.0.0.1:6379> sinter nums1 nums2 -1) "2" -2) "4" -127.0.0.1:6379> sunion nums1 nums2 -1) "1" -2) "2" -3) "3" -4) "4" -5) "5" -6) "6" -7) "8" -127.0.0.1:6379> sdiff nums1 nums2 -1) "1" -2) "3" -3) "5" -127.0.0.1:6379> zadd topsinger 5234 zhangxy 1978 chenyx 2235 zhoujl 3520 xuezq -(integer) 4 -127.0.0.1:6379> zrange topsinger 0 -1 withscores -1) "chenyx" -2) "1978" -3) "zhoujl" -4) "2235" -5) "xuezq" -6) "3520" -7) "zhangxy" -8) "5234" -127.0.0.1:6379> zrevrange topsinger 0 -1 -1) "zhangxy" -2) "xuezq" -3) "zhoujl" -4) "chenyx" -127.0.0.1:6379> zrevrank topsinger zhoujl -(integer) 2 -127.0.0.1:6379> geoadd pois 116.39738549206541 39.90862689286386 tiananmen -(integer) 1 -127.0.0.1:6379> geoadd pois 116.27172936413572 39.99135172904494 yiheyuan -(integer) 1 -127.0.0.1:6379> geoadd pois 117.27766503308104 40.65332064313784 gubeishuizhen -(integer) 1 -127.0.0.1:6379> geodist pois tiananmen gubeishuizhen km -"111.5333" -127.0.0.1:6379> geodist pois tiananmen yiheyuan km -"14.1230" -127.0.0.1:6379> georadius pois 116.86499108288572 40.40149669363615 50 km withdist -1) 1) "gubeishuizhen" - 2) "44.7408" -``` - -#### 在Python程序中使用Redis - -可以使用pip安装名为`redis`的三方库,该三方库的核心是一个名为`Redis`的类,`Redis`对象代表一个Redis客户端,通过该客户端可以向Redis服务器发送命令并获取执行的结果。上面我们在Redis客户端中使用的命令基本上就是`Redis`对象可以接收的消息,所以如果了解了Redis的命令就可以在Python中玩转Redis。 - -```Bash -pip3 install redis -``` - -进入Python交互式环境,使用`redis`三方库来操作Redis。 - -```Bash ->>> import redis ->>> ->>> client = redis.Redis(host='127.0.0.1', port=6379, password='yourpass') ->>> ->>> client.set('username', 'admin') -True ->>> client.hset('student', 'name', 'luohao') -1 ->>> client.hset('student', 'age', 40) -1 ->>> client.keys('*') -[b'username', b'student'] ->>> client.get('username') -b'admin' ->>> client.hgetall('student') -{b'name': b'luohao', b'age': b'40'} -``` - -### MongoDB概述 - -#### MongoDB简介 - -MongoDB是2009年问世的一个面向文档的数据库管理系统,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。虽然在划分类别的时候后,MongoDB被认为是NoSQL的产品,但是它更像一个介于关系数据库和非关系数据库之间的产品,在非关系数据库中它功能最丰富,最像关系数据库。 - -MongoDB将数据存储为一个文档,一个文档由一系列的“键值对”组成,其文档类似于JSON对象,但是MongoDB对JSON进行了二进制处理(能够更快的定位key和value),因此其文档的存储格式称为BSON。关于JSON和BSON的差别大家可以看看MongoDB官方网站的文章[《JSON and BSON》](https://www.mongodb.com/json-and-bson)。 - -目前,MongoDB已经提供了对Windows、macOS、Linux、Solaris等多个平台的支持,而且也提供了多种开发语言的驱动程序,Python当然是其中之一。 - -#### MongoDB的安装和启动 - -可以从MongoDB的[官方下载链接](https://www.mongodb.com/try/download/community)下载MongoDB,官方提供了Windows、macOS和多种Linux版本的安装包。下面以CentOS为例,简单说一下如何安装和启动MongoDB。 - -下载服务器和命令行的RPM安装包。 - -```Bash -wget https://repo.mongodb.org/yum/redhat/7/mongodb-org/4.4/x86_64/RPMS/mongodb-org-server-4.4.2-1.el7.x86_64.rpm -rpm -ivh mongodb-org-server-4.4.2-1.el7.x86_64.rpm -wget https://repo.mongodb.org/yum/redhat/7/mongodb-org/4.4/x86_64/RPMS/mongodb-org-shell-4.4.2-1.el7.x86_64.rpm -rpm -ivh mongodb-org-shell-4.4.2-1.el7.x86_64.rpm -``` - -启动MongoDB服务器,需要先创建保存数据的文件夹。 - -```Bash -mkdir -p /data/db -``` - -修改MongoDB的配置文件,将其中`bindIp`选项的值修改为本机IP地址而不是默认的`127.0.0.1`,本机IP地址可以通过`ifconfig`命令进行查看。 - -```Bash -vim /etc/mongod.conf -``` - -使用`systemctl`命令启动服务。 - -```Bash -systemctl start mongod -``` - -#### MongoDB基本概念 - -我们通过与关系型数据库的比较来说明MongoDB中的一些概念。 - -| SQL | MongoDB | -| --------------------- | ------------------ | -| database | database | -| table(表) | collection(集合) | -| row(行) | document(文档) | -| column(列) | field(字段) | -| index | index | -| table joins(表连接) | (嵌套文档) | -| primary key | primary key | - -#### 通过Shell操作MongoDB - -0. 启动命令行工具,进入交互式环境。 - - ```Bash - mongo - ``` - - > **说明**: - -1. 查看、创建和删除数据库。 - - ```JavaScript - > // 显示所有数据库 - > show dbs - admin 0.000GB - config 0.000GB - local 0.000GB - > // 创建并切换到school数据库 - > use school - switched to db school - > // 删除当前数据库 - > db.dropDatabase() - { "ok" : 1 } - ``` - -2. 创建、删除和查看集合。 - - ```JavaScript - > // 创建并切换到school数据库 - > use school - switched to db school - > // 创建colleges集合 - > db.createCollection('colleges') - { "ok" : 1 } - > // 创建students集合 - > db.createCollection('students') - { "ok" : 1 } - > // 查看所有集合 - > show collections - colleges - students - > // 删除colleges集合 - > db.colleges.drop() - true - ``` - - > **说明**:在MongoDB中插入文档时如果集合不存在会自动创建集合,所以也可以按照下面的方式通过插入文档来创建集合。 - -3. 文档的CRUD操作。 - - ```JavaScript - > // 向students集合插入文档 - > db.students.insert({stuid: 1001, name: '骆昊', age: 40}) - WriteResult({ "nInserted" : 1 }) - > // 向students集合插入文档 - > db.students.save({stuid: 1002, name: '王大锤', tel: '13012345678', gender: '男'}) - WriteResult({ "nInserted" : 1 }) - > // 查看所有文档 - > db.students.find() - { "_id" : ObjectId("5b13c72e006ad854460ee70b"), "stuid" : 1001, "name" : "骆昊", "age" : 38 } - { "_id" : ObjectId("5b13c790006ad854460ee70c"), "stuid" : 1002, "name" : "王大锤", "tel" : "13012345678", "gender" : "男" } - > // 更新stuid为1001的文档 - > db.students.update({stuid: 1001}, {'$set': {tel: '13566778899', gender: '男'}}) - WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 }) - > // 插入或更新stuid为1003的文档 - > db.students.update({stuid: 1003}, {'$set': {name: '白元芳', tel: '13022223333', gender: '男'}}, upsert=true) - WriteResult({ - "nMatched" : 0, - "nUpserted" : 1, - "nModified" : 0, - "_id" : ObjectId("5b13c92dd185894d7283efab") - }) - > // 查询所有文档 - > db.students.find().pretty() - { - "_id" : ObjectId("5b13c72e006ad854460ee70b"), - "stuid" : 1001, - "name" : "骆昊", - "age" : 38, - "gender" : "男", - "tel" : "13566778899" - } - { - "_id" : ObjectId("5b13c790006ad854460ee70c"), - "stuid" : 1002, - "name" : "王大锤", - "tel" : "13012345678", - "gender" : "男" - } - { - "_id" : ObjectId("5b13c92dd185894d7283efab"), - "stuid" : 1003, - "gender" : "男", - "name" : "白元芳", - "tel" : "13022223333" - } - > // 查询stuid大于1001的文档 - > db.students.find({stuid: {'$gt': 1001}}).pretty() - { - "_id" : ObjectId("5b13c790006ad854460ee70c"), - "stuid" : 1002, - "name" : "王大锤", - "tel" : "13012345678", - "gender" : "男" - } - { - "_id" : ObjectId("5b13c92dd185894d7283efab"), - "stuid" : 1003, - "gender" : "男", - "name" : "白元芳", - "tel" : "13022223333" - } - > // 查询stuid大于1001的文档只显示name和tel字段 - > db.students.find({stuid: {'$gt': 1001}}, {_id: 0, name: 1, tel: 1}).pretty() - { "name" : "王大锤", "tel" : "13012345678" } - { "name" : "白元芳", "tel" : "13022223333" } - > // 查询name为“骆昊”或者tel为“13022223333”的文档 - > db.students.find({'$or': [{name: '骆昊'}, {tel: '13022223333'}]}, {_id: 0, name: 1, tel: 1}).pretty() - { "name" : "骆昊", "tel" : "13566778899" } - { "name" : "白元芳", "tel" : "13022223333" } - > // 查询学生文档跳过第1条文档只查1条文档 - > db.students.find().skip(1).limit(1).pretty() - { - "_id" : ObjectId("5b13c790006ad854460ee70c"), - "stuid" : 1002, - "name" : "王大锤", - "tel" : "13012345678", - "gender" : "男" - } - > // 对查询结果进行排序(1表示升序,-1表示降序) - > db.students.find({}, {_id: 0, stuid: 1, name: 1}).sort({stuid: -1}) - { "stuid" : 1003, "name" : "白元芳" } - { "stuid" : 1002, "name" : "王大锤" } - { "stuid" : 1001, "name" : "骆昊" } - > // 在指定的一个或多个字段上创建索引 - > db.students.ensureIndex({name: 1}) - { - "createdCollectionAutomatically" : false, - "numIndexesBefore" : 1, - "numIndexesAfter" : 2, - "ok" : 1 - } - ``` - -使用MongoDB可以非常方便的配置数据复制,通过冗余数据来实现数据的高可用以及灾难恢复,也可以通过数据分片来应对数据量迅速增长的需求。关于MongoDB更多的操作可以查阅[官方文档](https://mongodb-documentation.readthedocs.io/en/latest/) ,同时推荐大家阅读Kristina Chodorow写的[《MongoDB权威指南》](http://www.ituring.com.cn/book/1172)。 - -#### 在Python程序中操作MongoDB - -可以通过pip安装`pymongo`来实现对MongoDB的操作。 - -```Shell -pip install pymongo -``` - -进入Python交互式环境,就可以执行以下的操作。 - -```Python ->>> from pymongo import MongoClient ->>> ->>> client = MongoClient('mongodb://127.0.0.1:27017') ->>> db = client.school ->>> for student in db.students.find(): -... print('学号:', student['stuid']) -... print('姓名:', student['name']) -... print('电话:', student['tel']) -... -学号: 1001.0 -姓名: 骆昊 -电话: 13566778899 -学号: 1002.0 -姓名: 王大锤 -电话: 13012345678 -学号: 1003.0 -姓名: 白元芳 -电话: 13022223333 ->>> db.students.find().count() -3 ->>> db.students.remove() -{'n': 3, 'ok': 1.0} ->>> db.students.find().count() -0 ->>> from pymongo import ASCENDING ->>> ->>> coll = db.students ->>> coll.create_index([('name', ASCENDING)], unique=True) -'name_1' ->>> coll.insert_one({'stuid': int(1001), 'name': '骆昊', 'gender': True}) - ->>> coll.insert_many([{'stuid': int(1002), 'name': '王大锤', 'gender': False}, {'stuid': int(1003), 'name': '白元芳', 'gender': True}]) - ->>> for student in coll.find({'gender': True}): -... print('学号:', student['stuid']) -... print('姓名:', student['name']) -... print('性别:', '男' if student['gender'] else '女') -... -学号: 1001 -姓名: 骆昊 -性别: 男 -学号: 1003 -姓名: 白元芳 -性别: 男 -``` - -关于[`pymongo`](https://api.mongodb.com/python/current/tutorial.html)更多的知识可以通过它的官方文档进行了解,也可以使用[`MongoEngine`]()这样的库来简化Python程序对MongoDB的操作,除此之外,还有以异步I/O方式访问MongoDB的三方库[`motor`]()都是不错的选择。 \ No newline at end of file diff --git a/Day36-40/res/redis-aof.png b/Day36-40/res/redis-aof.png deleted file mode 100755 index f7575df..0000000 Binary files a/Day36-40/res/redis-aof.png and /dev/null differ diff --git a/Day36-40/res/redis-bind-and-port.png b/Day36-40/res/redis-bind-and-port.png deleted file mode 100755 index dc26d98..0000000 Binary files a/Day36-40/res/redis-bind-and-port.png and /dev/null differ diff --git a/Day36-40/res/redis-data-types.png b/Day36-40/res/redis-data-types.png deleted file mode 100755 index a45625c..0000000 Binary files a/Day36-40/res/redis-data-types.png and /dev/null differ diff --git a/Day36-40/res/redis-databases.png b/Day36-40/res/redis-databases.png deleted file mode 100755 index b6f8a92..0000000 Binary files a/Day36-40/res/redis-databases.png and /dev/null differ diff --git a/Day36-40/res/redis-hash.png b/Day36-40/res/redis-hash.png deleted file mode 100755 index 0d86fd0..0000000 Binary files a/Day36-40/res/redis-hash.png and /dev/null differ diff --git a/Day36-40/res/redis-list.png b/Day36-40/res/redis-list.png deleted file mode 100755 index 00f23f3..0000000 Binary files a/Day36-40/res/redis-list.png and /dev/null differ diff --git a/Day36-40/res/redis-rdb-1.png b/Day36-40/res/redis-rdb-1.png deleted file mode 100755 index b868bc5..0000000 Binary files a/Day36-40/res/redis-rdb-1.png and /dev/null differ diff --git a/Day36-40/res/redis-rdb-3.png b/Day36-40/res/redis-rdb-3.png deleted file mode 100755 index 958702f..0000000 Binary files a/Day36-40/res/redis-rdb-3.png and /dev/null differ diff --git a/Day36-40/res/redis-replication.png b/Day36-40/res/redis-replication.png deleted file mode 100755 index 657508b..0000000 Binary files a/Day36-40/res/redis-replication.png and /dev/null differ diff --git a/Day36-40/res/redis-security.png b/Day36-40/res/redis-security.png deleted file mode 100755 index 3c70471..0000000 Binary files a/Day36-40/res/redis-security.png and /dev/null differ diff --git a/Day36-40/res/redis-set.png b/Day36-40/res/redis-set.png deleted file mode 100755 index b9f15c3..0000000 Binary files a/Day36-40/res/redis-set.png and /dev/null differ diff --git a/Day36-40/res/redis-slow-logs.png b/Day36-40/res/redis-slow-logs.png deleted file mode 100755 index 10816aa..0000000 Binary files a/Day36-40/res/redis-slow-logs.png and /dev/null differ diff --git a/Day36-40/res/redis-string.png b/Day36-40/res/redis-string.png deleted file mode 100755 index 60d9b5b..0000000 Binary files a/Day36-40/res/redis-string.png and /dev/null differ diff --git a/Day36-40/res/redis-zset.png b/Day36-40/res/redis-zset.png deleted file mode 100755 index c87b486..0000000 Binary files a/Day36-40/res/redis-zset.png and /dev/null differ diff --git a/Day36-40/36.关系型数据库和MySQL概述.md b/Day36-45/36.关系型数据库和MySQL概述.md similarity index 80% rename from Day36-40/36.关系型数据库和MySQL概述.md rename to Day36-45/36.关系型数据库和MySQL概述.md index 5bb33a1..d5cd357 100755 --- a/Day36-40/36.关系型数据库和MySQL概述.md +++ b/Day36-45/36.关系型数据库和MySQL概述.md @@ -10,29 +10,31 @@ 3. 关系数据库特点。 - - 理论基础:**关系代数**(关系运算、集合论、一阶谓词逻辑)。 - + - 理论基础:**关系代数**(集合论、一阶谓词、关系运算)。 - 具体表象:用**二维表**(有行和列)组织数据。 - - 编程语言:**结构化查询语言**(SQL)。 - + - DDL:数据定义语言 + - DML:数据操作语言 + - DCL:数据控制语言 + - TCL:事务控制语言 + 4. ER模型(实体关系模型)和概念模型图。 **ER模型**,全称为**实体关系模型**(Entity-Relationship Model),由美籍华裔计算机科学家陈品山先生提出,是概念数据模型的高层描述方式,如下图所示。 - + - 实体 - 矩形框 - 属性 - 椭圆框 - 关系 - 菱形框 - 重数 - 1:1(一对一) / 1:N(一对多) / M:N(多对多) - 实际项目开发中,我们可以利用数据库建模工具(如:PowerDesigner)来绘制概念数据模型(其本质就是 ER 模型),然后再设置好目标数据库系统,将概念模型转换成物理模型,最终生成创建二维表的 SQL(很多工具都可以根据我们设计的物理模型图以及设定的目标数据库来导出 SQL 或直接生成数据表)。 + 实际项目开发中,我们可以利用数据库建模工具(如:PowerDesigner)来绘制概念数据模型,然后再设置好目标数据库系统,将概念模型转换成物理模型(如下图所示),最终生成创建二维表的 SQL(很多工具都可以根据我们设计的物理模型图以及设定的目标数据库来导出 SQL 或直接生成数据表)。 - ![](https://gitee.com/jackfrued/mypic/raw/master/20210826003212.png) + 5. 关系数据库产品。 - - [Oracle](https://www.oracle.com/index.html) - 目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库,它实现了分布式处理的功能。在 Oracle 最新的 12c 版本中,还引入了多承租方架构,使用该架构可轻松部署和管理数据库云。 + - [Oracle](https://www.oracle.com/index.html) - 目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库,它实现了分布式处理的功能。在 Oracle 较新的版本中,还引入了多承租方架构,使用该架构可轻松部署和管理数据库云。 - [DB2](https://www.ibm.com/analytics/us/en/db2/) - IBM 公司开发的、主要运行于 Unix(包括 IBM 自家的 [AIX](https://zh.wikipedia.org/wiki/AIX))、Linux、以及 Windows 服务器版等系统的关系数据库产品。DB2 历史悠久且被认为是最早使用 SQL 的数据库产品,它拥有较为强大的商业智能功能。 - [SQL Server](https://www.microsoft.com/en-us/sql-server/) - 由 Microsoft 开发和推广的关系型数据库产品,最初适用于中小企业的数据管理,但是近年来它的应用范围有所扩展,部分大企业甚至是跨国公司也开始基于它来构建自己的数据管理系统。 - [MySQL](https://www.mysql.com/) - MySQL 是开放源代码的,任何人都可以在 GPL(General Public License)的许可下下载并根据个性化的需要对其进行修改。MySQL 因为其速度、可靠性和适应性而备受关注。 @@ -42,7 +44,7 @@ MySQL 最早是由瑞典的 MySQL AB 公司开发的一个开放源码的关系数据库管理系统,该公司于2008年被昇阳微系统公司(Sun Microsystems)收购。在2009年,甲骨文公司(Oracle)收购昇阳微系统公司,因此 MySQL 目前也是 Oracle 旗下产品。 -MySQL 在过去由于性能高、成本低、可靠性好,已经成为最流行的开源数据库,因此被广泛地应用于中小型网站开发。随着 MySQL 的不断成熟,它也逐渐被应用于更多大规模网站和应用,比如维基百科、谷歌(Google)、脸书(Facebook)、淘宝网等网站都使用了 MySQL 来提供数据持久化服务。 +MySQL 在过去由于性能高、成本低、可靠性好,已经成为最流行的开源数据库,因此被广泛地应用于中小型网站开发。随着 MySQL 的不断成熟,它也逐渐被应用于更多大规模网站和应用,比如维基百科、谷歌(Google)、脸书(Facebook)、百度、淘宝、腾讯、新浪、去哪儿等都使用了 MySQL 来提供数据持久化服务。 甲骨文公司收购后昇阳微系统公司,大幅调涨 MySQL 商业版的售价,且甲骨文公司不再支持另一个自由软件项目 [OpenSolaris ](https://zh.wikipedia.org/wiki/OpenSolaris) 的发展,因此导致自由软件社区对于 Oracle 是否还会持续支持 MySQL 社区版(MySQL 的各个发行版本中唯一免费的版本)有所担忧,MySQL 的创始人麦克尔·维德纽斯以 MySQL 为基础,创建了 [MariaDB](https://zh.wikipedia.org/wiki/MariaDB)(以他女儿的名字命名的数据库)分支。有许多原来使用 MySQL 数据库的公司(例如:维基百科)已经陆续完成了从 MySQL 数据库到 MariaDB 数据库的迁移。 @@ -52,85 +54,85 @@ MySQL 在过去由于性能高、成本低、可靠性好,已经成为最流 1. 通过[官方网站](https://www.mysql.com/)提供的[下载链接](https://dev.mysql.com/downloads/windows/installer/8.0.html)下载“MySQL社区版服务器”安装程序,如下图所示,建议大家下载离线安装版的MySQL Installer。 - + 2. 运行 Installer,按照下面的步骤进行安装。 - 选择自定义安装。 - + - 选择需要安装的组件。 - + - 如果缺少依赖项,需要先安装依赖项。 - + - 准备开始安装。 - + - 安装完成。 - + - 准备执行配置向导。 - + 3. 执行安装后的配置向导。 - 配置服务器类型和网络。 - + - 配置认证方法(保护密码的方式)。 - + - 配置用户和角色。 - + - 配置Windows服务名以及是否开机自启。 - + - 配置日志。 - + - 配置高级选项。 - ACAC15B8633133B65476286A49BFBD7E + ACAC15B8633133B65476286A49BFBD7E - 应用配置。 - + 4. 可以在 Windows 系统的“服务”窗口中启动或停止 MySQL。 - + 5. 配置 PATH 环境变量,以便在命令行提示符窗口使用 MySQL 客户端工具。 - 打开 Windows 的“系统”窗口并点击“高级系统设置”。 - + - 在“系统属性”的“高级”窗口,点击“环境变量”按钮。 - + - 修改PATH环境变量,将MySQL安装路径下的`bin`文件夹的路径配置到PATH环境变量中。 - + - 配置完成后,可以尝试在“命令提示符”下使用 MySQL 的命令行工具。 - + #### Linux 环境 @@ -273,22 +275,22 @@ MySQL 在过去由于性能高、成本低、可靠性好,已经成为最流 - MySQL Workbench(官方工具) - + - Navicat for MySQL(界面简单友好) - + #### macOS环境 macOS 系统安装 MySQL 是比较简单的,只需要从刚才说到的官方网站下载 DMG 安装文件并运行就可以了,下载的时候需要根据自己使用的是 Intel 的芯片还是苹果的 M1 芯片选择下载链接,如下图所示。 - + 安装成功后,可以在“系统偏好设置”中找到“MySQL”,在如下所示的画面中,可以启动和停止 MySQL 服务器,也可以对 MySQL 核心文件的路径进行配置。 - + ### MySQL 基本命令 @@ -384,5 +386,3 @@ show tables; 12. 退出命令行 - `quit`或`exit`。 - - diff --git a/Day36-45/37.SQL详解之DDL.md b/Day36-45/37.SQL详解之DDL.md new file mode 100755 index 0000000..d285992 --- /dev/null +++ b/Day36-45/37.SQL详解之DDL.md @@ -0,0 +1,415 @@ +## SQL详解之DDL + +我们通常可以将 SQL 分为四类,分别是 DDL(数据定义语言)、DML(数据操作语言)、 DCL(数据控制语言)和 TCL(事务控制语言)。DDL 主要用于创建、删除、修改数据库中的对象,比如创建、删除和修改二维表,核心的关键字包括`create`、`drop`和`alter`;DML 主要负责数据的插入、删除、更新和查询,关键词包括`insert`、`delete`、`update`和`select`;DCL 用于授予和召回权限,核心关键词是`grant`和`revoke`;TCL 通常用于事务控制。 + +> **说明**:SQL 是不区分大小写的语言,有人会建议将关键字大写,其他部分小写。为了书写和识别方便,下面的 SQL 我都是使用小写字母进行书写的。 如果公司的 SQL 编程规范有强制规定,那么就按照公司的要求来,个人的喜好不应该凌驾于公司的编程规范之上,这一点对职业人来说应该是常识。 + +### 建库建表 + +下面我们来实现一个非常简单的学校选课系统的数据库。我们将数据库命名为`school`,四个关键的实体分别是学院、老师、学生和课程,其中,学生跟学院是从属关系,这个关系从数量上来讲是多对一关系,因为一个学院可以有多名学生,而一个学生通常只属于一个学院;同理,老师跟学院的从属关系也是多对一关系。一名老师可以讲授多门课程,一门课程如果只有一个授课老师的话,那么课程跟老师也是多对一关系;如果允许多个老师合作讲授一门课程,那么课程和老师就是多对多关系。简单起见,我们将课程和老师设计为多对一关系。学生和课程是典型的多对多关系,因为一个学生可以选择多门课程,一门课程也可以被多个学生选择,而关系型数据库需要借助中间表才能维持维持两个实体的多对多关系。最终,我们的学校选课系统一共有五张表,分别是学院表(`tb_college`)、学生表(`tb_student`)、教师表(`tb_teacher`)、课程表(`tb_course`)和选课记录表(`tb_record`),其中选课记录表就是维持学生跟课程多对多关系的中间表。 + +```SQL +-- 如果存在名为school的数据库就删除它 +drop database if exists `school`; + +-- 创建名为school的数据库并设置默认的字符集和排序方式 +create database `school` default character set utf8mb4 collate utf8mb4_general_ci; + +-- 切换到school数据库上下文环境 +use `school`; + +-- 创建学院表 +create table `tb_college` +( +`col_id` int unsigned auto_increment comment '编号', +`col_name` varchar(50) not null comment '名称', +`col_intro` varchar(500) default '' comment '介绍', +primary key (`col_id`) +) engine=innodb auto_increment=1 comment '学院表'; + +-- 创建学生表 +create table `tb_student` +( +`stu_id` int unsigned not null comment '学号', +`stu_name` varchar(20) not null comment '姓名', +`stu_sex` boolean default 1 not null comment '性别', +`stu_birth` date not null comment '出生日期', +`stu_addr` varchar(255) default '' comment '籍贯', +`col_id` int unsigned not null comment '所属学院', +primary key (`stu_id`), +constraint `fk_student_col_id` foreign key (`col_id`) references `tb_college` (`col_id`) +) engine=innodb comment '学生表'; + +-- 创建教师表 +create table `tb_teacher` +( +`tea_id` int unsigned not null comment '工号', +`tea_name` varchar(20) not null comment '姓名', +`tea_title` varchar(10) default '助教' comment '职称', +`col_id` int unsigned not null comment '所属学院', +primary key (`tea_id`), +constraint `fk_teacher_col_id` foreign key (`col_id`) references `tb_college` (`col_id`) +) engine=innodb comment '老师表'; + +-- 创建课程表 +create table `tb_course` +( +`cou_id` int unsigned not null comment '编号', +`cou_name` varchar(50) not null comment '名称', +`cou_credit` int not null comment '学分', +`tea_id` int unsigned not null comment '授课老师', +primary key (`cou_id`), +constraint `fk_course_tea_id` foreign key (`tea_id`) references `tb_teacher` (`tea_id`) +) engine=innodb comment '课程表'; + +-- 创建选课记录表 +create table `tb_record` +( +`rec_id` bigint unsigned auto_increment comment '选课记录号', +`stu_id` int unsigned not null comment '学号', +`cou_id` int unsigned not null comment '课程编号', +`sel_date` date not null comment '选课日期', +`score` decimal(4,1) comment '考试成绩', +primary key (`rec_id`), +constraint `fk_record_stu_id` foreign key (`stu_id`) references `tb_student` (`stu_id`), +constraint `fk_record_cou_id` foreign key (`cou_id`) references `tb_course` (`cou_id`), +constraint `uk_record_stu_cou` unique (`stu_id`, `cou_id`) +) engine=innodb comment '选课记录表'; +``` + +上面的DDL有几个地方需要强调一下: + +- 首先,上面 SQL 中的数据库名、表名、字段名都被反引号(`)包裹起来,反引号并不是必须的,但是却可以解决表名、字段名等跟 SQL 关键字(SQL 中有特殊含义的单词)冲突的问题。 + +- 创建数据库时,我们通过`default character set utf8mb4`指定了数据库默认使用的字符集为`utf8mb4`(最大`4`字节的`utf-8`编码),我们推荐使用该字符集,它也是 MySQL 8.x 默认使用的字符集,因为它能够支持国际化编码,还可以存储 Emoji 字符。可以通过下面的命令查看 MySQL 支持的字符集以及默认的排序规则。 + + ```SQL + show character set; + ``` + + ``` + +----------+---------------------------------+---------------------+--------+ + | Charset | Description | Default collation | Maxlen | + +----------+---------------------------------+---------------------+--------+ + | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | + | dec8 | DEC West European | dec8_swedish_ci | 1 | + | cp850 | DOS West European | cp850_general_ci | 1 | + | hp8 | HP West European | hp8_english_ci | 1 | + | koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 | + | latin1 | cp1252 West European | latin1_swedish_ci | 1 | + | latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 | + | swe7 | 7bit Swedish | swe7_swedish_ci | 1 | + | ascii | US ASCII | ascii_general_ci | 1 | + | ujis | EUC-JP Japanese | ujis_japanese_ci | 3 | + | sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 | + | hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 | + | tis620 | TIS620 Thai | tis620_thai_ci | 1 | + | euckr | EUC-KR Korean | euckr_korean_ci | 2 | + | koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 | + | gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 | + | greek | ISO 8859-7 Greek | greek_general_ci | 1 | + | cp1250 | Windows Central European | cp1250_general_ci | 1 | + | gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 | + | latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 | + | armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 | + | utf8 | UTF-8 Unicode | utf8_general_ci | 3 | + | ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 | + | cp866 | DOS Russian | cp866_general_ci | 1 | + | keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 | + | macce | Mac Central European | macce_general_ci | 1 | + | macroman | Mac West European | macroman_general_ci | 1 | + | cp852 | DOS Central European | cp852_general_ci | 1 | + | latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 | + | utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 | + | cp1251 | Windows Cyrillic | cp1251_general_ci | 1 | + | utf16 | UTF-16 Unicode | utf16_general_ci | 4 | + | utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 | + | cp1256 | Windows Arabic | cp1256_general_ci | 1 | + | cp1257 | Windows Baltic | cp1257_general_ci | 1 | + | utf32 | UTF-32 Unicode | utf32_general_ci | 4 | + | binary | Binary pseudo charset | binary | 1 | + | geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 | + | cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 | + | eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 | + | gb18030 | China National Standard GB18030 | gb18030_chinese_ci | 4 | + +----------+---------------------------------+---------------------+--------+ + 41 rows in set (0.00 sec) + ``` + + 如果要设置 MySQL 服务启动时默认使用的字符集,可以修改MySQL的配置并添加以下内容。 + + ```INI + [mysqld] + character-set-server=utf8 + ``` + + > **提示**:如果不清楚如何修改 MySQL 的配置文件就先不要管它。 + +- 创建和删除数据库时,关键字`database`也可以替换为`schema`,二者作用相同。 + +- 建表语句中的`not null`是非空约束,它限定了字段不能为空;`default`用于为字段指定默认值,我们称之为默认值约束;`primary key`是主键约束,它设定了能够唯一确定一条记录的列,也确保了每条记录都是独一无二的,因为主键不允许重复;`foreign key`是外键约束,它维持了两张表的参照完整性,举个例子,由于学生表中为 col_id 字段添加了外键约束,限定其必须引用(`references`)学院表中的 col_id,因此学生表中的学院编号必须来自于学院表中的学院编号,不能够随意为该字段赋值。如果需要给主键约束、外键约束等起名字,可以使用`constriant`关键字并在后面跟上约束的名字。 + +- 建表语句中的`comment` 关键字用来给列和表添加注释,增强代码的可读性和可维护性。 + +- 在创建表的时候,可以自行选择底层的存储引擎。MySQL 支持多种存储引擎,可以通过`show engines`命令进行查看。MySQL 5.5 以后的版本默认使用的存储引擎是 InnoDB,它是我们推荐大家使用的存储引擎(因为更适合当下互联网应用对高并发、性能以及事务支持等方面的需求),为了 SQL 语句的向下兼容性,我们可以在建表语句结束处右圆括号的后面通过`engine=innodb`来指定使用 InnoDB 存储引擎。 + + ```SQL + show engines\G + ``` + + > **说明**:上面的 \G 是为了换一种输出方式,在命令行客户端中,如果表的字段很多一行显示不完,就会导致输出的内容看起来非常不舒服,使用 \G 可以将记录的每个列以独占整行的的方式输出,这种输出方式在命令行客户端中看起来会舒服很多。 + + ``` + *************************** 1. row *************************** + Engine: InnoDB + Support: DEFAULT + Comment: Supports transactions, row-level locking, and foreign keys + Transactions: YES + XA: YES + Savepoints: YES + *************************** 2. row *************************** + Engine: MRG_MYISAM + Support: YES + Comment: Collection of identical MyISAM tables + Transactions: NO + XA: NO + Savepoints: NO + *************************** 3. row *************************** + Engine: MEMORY + Support: YES + Comment: Hash based, stored in memory, useful for temporary tables + Transactions: NO + XA: NO + Savepoints: NO + *************************** 4. row *************************** + Engine: BLACKHOLE + Support: YES + Comment: /dev/null storage engine (anything you write to it disappears) + Transactions: NO + XA: NO + Savepoints: NO + *************************** 5. row *************************** + Engine: MyISAM + Support: YES + Comment: MyISAM storage engine + Transactions: NO + XA: NO + Savepoints: NO + *************************** 6. row *************************** + Engine: CSV + Support: YES + Comment: CSV storage engine + Transactions: NO + XA: NO + Savepoints: NO + *************************** 7. row *************************** + Engine: ARCHIVE + Support: YES + Comment: Archive storage engine + Transactions: NO + XA: NO + Savepoints: NO + *************************** 8. row *************************** + Engine: PERFORMANCE_SCHEMA + Support: YES + Comment: Performance Schema + Transactions: NO + XA: NO + Savepoints: NO + *************************** 9. row *************************** + Engine: FEDERATED + Support: NO + Comment: Federated MySQL storage engine + Transactions: NULL + XA: NULL + Savepoints: NULL + 9 rows in set (0.00 sec) + ``` + + 下面的表格对MySQL几种常用的数据引擎进行了简单的对比。 + + | 特性 | InnoDB | MRG_MYISAM | MEMORY | MyISAM | + | ------------ | ------------ | ---------- | ------ | ------ | + | 存储限制 | 有 | 没有 | 有 | 有 | + | 事务 | 支持 | | | | + | 锁机制 | 行锁 | 表锁 | 表锁 | 表锁 | + | B树索引 | 支持 | 支持 | 支持 | 支持 | + | 哈希索引 | | | 支持 | | + | 全文检索 | 支持(5.6+) | | | 支持 | + | 集群索引 | 支持 | | | | + | 数据缓存 | 支持 | | 支持 | | + | 索引缓存 | 支持 | 支持 | 支持 | 支持 | + | 数据可压缩 | | | | 支持 | + | 内存使用 | 高 | 低 | 中 | 低 | + | 存储空间使用 | 高 | 低 | | 低 | + | 批量插入性能 | 低 | 高 | 高 | 高 | + | 是否支持外键 | 支持 | | | | + + 通过上面的比较我们可以了解到,InnoDB 是唯一能够支持外键、事务以及行锁的存储引擎,所以我们之前说它更适合互联网应用,而且在较新版本的 MySQL 中,它也是默认使用的存储引擎。 + +- 在定义表结构为每个字段选择数据类型时,如果不清楚哪个数据类型更合适,可以通过 MySQL 的帮助系统来了解每种数据类型的特性、数据的长度和精度等相关信息。 + + ```SQL + ? data types + ``` + + > **说明**:在 MySQLWorkbench 中,不能使用`?`获取帮助,要使用对应的命令`help`。 + + ``` + You asked for help about help category: "Data Types" + For more information, type 'help ', where is one of the following + topics: + AUTO_INCREMENT + BIGINT + BINARY + BIT + BLOB + BLOB DATA TYPE + BOOLEAN + CHAR + CHAR BYTE + DATE + DATETIME + DEC + DECIMAL + DOUBLE + DOUBLE PRECISION + ENUM + FLOAT + INT + INTEGER + LONGBLOB + LONGTEXT + MEDIUMBLOB + MEDIUMINT + MEDIUMTEXT + SET DATA TYPE + SMALLINT + TEXT + TIME + TIMESTAMP + TINYBLOB + TINYINT + TINYTEXT + VARBINARY + VARCHAR + YEAR DATA TYPE + ``` + + 获取 varchar 类型的帮助: + + ```SQL + ? varchar + ``` + + 执行结果: + + ``` + Name: 'VARCHAR' + Description: + [NATIONAL] VARCHAR(M) [CHARACTER SET charset_name] [COLLATE + collation_name] + + A variable-length string. M represents the maximum column length in + characters. The range of M is 0 to 65,535. The effective maximum length + of a VARCHAR is subject to the maximum row size (65,535 bytes, which is + shared among all columns) and the character set used. For example, utf8 + characters can require up to three bytes per character, so a VARCHAR + column that uses the utf8 character set can be declared to be a maximum + of 21,844 characters. See + http://dev.mysql.com/doc/refman/5.7/en/column-count-limit.html. + + MySQL stores VARCHAR values as a 1-byte or 2-byte length prefix plus + data. The length prefix indicates the number of bytes in the value. A + VARCHAR column uses one length byte if values require no more than 255 + bytes, two length bytes if values may require more than 255 bytes. + + *Note*: + + MySQL follows the standard SQL specification, and does not remove + trailing spaces from VARCHAR values. + + VARCHAR is shorthand for CHARACTER VARYING. NATIONAL VARCHAR is the + standard SQL way to define that a VARCHAR column should use some + predefined character set. MySQL uses utf8 as this predefined character + set. http://dev.mysql.com/doc/refman/5.7/en/charset-national.html. + NVARCHAR is shorthand for NATIONAL VARCHAR. + + URL: http://dev.mysql.com/doc/refman/5.7/en/string-type-overview.html + ``` + + 在数据类型的选择上,保存字符串数据通常都使用 VARCHAR 和 CHAR 两种类型,前者通常称为变长字符串,而后者通常称为定长字符串;对于 InnoDB 存储引擎,行存储格式没有区分固定长度和可变长度列,因此 VARCHAR 类型和 CHAR 类型没有本质区别,后者不一定比前者性能更好。如果要保存的很大字符串,可以使用 TEXT 类型;如果要保存很大的字节串,可以使用 BLOB(二进制大对象)类型。在 MySQL 中,TEXT 和 BLOB又分别包括 TEXT、MEDIUMTEXT、LONGTEXT 和 BLOB、MEDIUMBLOB、LONGBLOB 三种不同的类型,它们主要的区别在于存储数据的最大大小不同。保存浮点数可以用 FLOAT 或 DOUBLE 类型,FLOAT 已经不推荐使用了,而且在 MySQL 后续的版本中可能会被移除掉。而保存定点数应该使用 DECIMAL 类型,它可以指定小数点前后有效数字的位数。如果要保存时间日期,DATETIME 类型优于 TIMESTAMP 类型,因为前者能表示的时间日期范围更大,后者底层其实就是一个整数,记录了指定的日期时间和 1970-01-01 00:00:00 相差多少个毫秒,该类型在 2038-01-19 03:14:07 之后就会溢出。 + + 对于自增字段 AUTO_INCREMENT,如果使用 MySQL 5.x 版本要注意自增字段的回溯问题,当然这个问题在 MySQL 8.x 中已经得到了很好的解决,当然,MySQL 8.x 还有很多其他的好处,不管是功能还是性能上都有很多的优化和调整,因此强烈推荐大家使用 MySQL 8.x 版本。对于高并发访问数据库的场景,AUTO_INCREMENT 不仅存在性能上的问题,还可能在多机结构上产生重复的 ID 值,在这种场景下,使用分布式 ID 生成算法(SnowFlake、TinyID等)才是最好的选择,有兴趣的读者可以自行研究。 + +### 删除表和修改表 + +下面以学生表为例,为大家说明如何删除表和修改表。删除表可以使用`drop table`,代码如下所示。 + +```SQL +drop table `tb_student`; +``` + +或 + +```SQL +drop table if exists `tb_student`; +``` + +需要注意的是,如果学生表已经录入了数据而且该数据被其他表引用了,那么就不能删除学生表,否则上面的操作会报错。在下一课中,我们会讲解如何向表中插入数据,到时候大家可以试一试,能否顺利删除学生表。 + +如果要修改学生表,可以使用`alter table`,具体可以分为以下几种情况: + +修改表,添加一个新列,例如给学生表添加一个联系电话的列。 + +```SQL +alter table `tb_student` add column `stu_tel` varchar(20) not null comment '联系电话'; +``` + +> **注意**:如果新增列的时候指定了非空约束(`not null`),那么学生表不能够有数据,否则原来的数据增加了 stu_tel 列之后是没有数据的,这就违反了非空约束的要求;当然,我们在添加列的时候也可以使用默认值约束来解决这个问题。 + +修改表,删除指定的列,例如将上面添加的联系电话列删除掉。 + +```SQL +alter table `tb_student` drop column `stu_tel`; +``` + +修改表,修改列的数据类型,例如将学生表的 stu_sex 修改为字符。 + +```SQL +alter table `tb_student` modify column `stu_sex` char(1) not null default 'M' comment '性别'; +``` + +修改表,修改列的命名,例如将学生表的 stu_sex 修改为 stu_gender。 + +```SQL +alter table `tb_student` change column `stu_sex` `stu_gender` boolean default 1 comment '性别'; +``` + +修改表,删除约束条件,例如删除学生表的 col_id 列的外键约束。 + +```SQL +alter table `tb_student` drop foreign key `fk_student_col_id`; +``` + +修改表,添加约束条件,例如给学生表的 col_id 列加上外键约束。 + +```SQL +alter table `tb_student` add foreign key (`col_id`) references `tb_college` (`col_id`); +``` + +或 + +```SQL +alter table `tb_student` add constraint `fk_student_col_id` foreign key (`col_id`) references `tb_college` (`col_id`); +``` + +> **说明**:在添加外键约束时,还可以通过`on update`和`on delete`来指定在被引用的表发生删除和更新操作时,应该进行何种处理,二者的默认值都是`restrict`,表示如果存在外键约束,则不允许更新和删除被引用的数据。除了`restrict`之外,这里可能的取值还有`cascade`(级联操作)和`set null`(设置为空),有兴趣的读者可以自行研究。 + +修改表的名字,例如将学生表的名字修改为 tb_stu_info。 + +```SQL +alter table `tb_student` rename to `tb_stu_info`; +``` + +> **提示**:一般情况下,请不要轻易修改数据库或表的名字。 \ No newline at end of file diff --git a/Day36-45/38.SQL详解之DML.md b/Day36-45/38.SQL详解之DML.md new file mode 100755 index 0000000..78f28db --- /dev/null +++ b/Day36-45/38.SQL详解之DML.md @@ -0,0 +1,159 @@ +## SQL详解之DML + +我们接着上一课中创建的学校选课系统数据库,为大家讲解 DML 的使用。DML 可以帮助将数据插入到二维表(`insert`操作)、从二维表删除数据(`delete`操作)以及更新二维表的数据(`update`操作)。在执行 DML 之前,我们先通过下面的`use`命令切换到`school`数据库。 + +```SQL +use `school`; +``` + +### insert操作 + +顾名思义,`insert`是用来插入行到二维表中的,插入的方式包括:插入完整的行、插入行的一部分、插入多行、插入查询的结果。我们通过如下所示的 SQL 向学院表中添加一个学院。 + +```SQL +insert into `tb_college` values (default, '计算机学院', '学习计算机科学与技术的地方'); +``` + +其中,由于学院表的主键是一个自增字段,因此上面的 SQL 中用`default`表示该列使用默认值,我们也可以使用下面的方式完成同样的操作。 + +```SQL +insert into `tb_college` (`col_name`, `col_intro`) values ('计算机学院', '学习计算机科学与技术的地方'); +``` + +我们推荐大家使用下面这种做法,指定为哪些字段赋值,这样做可以不按照建表时设定的字段顺序赋值,可以按照`values`前面的元组中给定的字段顺序为字段赋值,但是需要注意,除了允许为`null`和有默认值的字段外,其他的字段都必须要一一列出并在`values`后面的元组中为其赋值。如果希望一次性插入多条记录,我们可以在`values`后面跟上多个元组来实现批量插入,代码如下所示。 + +```SQL +insert into `tb_college` + (`col_name`, `col_intro`) +values + ('外国语学院', '学习歪果仁的语言的学院'), + ('经济管理学院', '经世济民,治理国家;管理科学,兴国之道'), + ('体育学院', '发展体育运动,增强人民体质'); +``` + +在插入数据时,要注意主键是不能重复的,如果插入的数据与表中已有记录主键相同,那么`insert`操作将会产生 Duplicated Entry 的报错信息。再次提醒大家,如果`insert`操作省略了某些列,那么这些列要么有默认值,要么允许为`null`,否则也将产生错误。在业务系统中,为了让`insert`操作不影响其他操作(主要是后面要讲的`select`操作)的性能,可以在`insert`和`into`之间加一个`low_priority`来降低`insert`操作的优先级,这个做法也适用于下面要讲的`delete`和`update`操作。 + +假如有一张名为`tb_temp`的表中有`a`和`b`两个列,分别保存了学院的名称和学院的介绍,我们也可以通过查询操作获得`tb_temp`表的数据并插入到学院表中,如下所示,其中的`select`就是我们之前提到的 DQL,在下一课中会详细讲解。 + +```SQL +insert into `tb_college` + (`col_name`, `col_intro`) +select `a`, `b` from `tb_temp`; +``` + +### delete 操作 + +如果需要从表中删除数据,可以使用`delete`操作,它可以帮助我们删除指定行或所有行,例如我们要删除编号为`1`的学院,就可以使用如下所示的 SQL。 + +```SQL +delete from `tb_college` where col_id=1; +``` + +注意,上面的`delete`操作中的`where`子句是用来指定条件的,只有满足条件的行会被删除。如果我们不小心写出了下面的 SQL,就会删除学院表中所有的记录,这是相当危险的,在实际工作中通常也不会这么做。 + +```SQL +delete from `tb_college`; +``` + +需要说明的是,即便删除了所有的数据,`delete`操作不会删除表本身,也不会让 AUTO_INCREMENT 字段的值回到初始值。如果需要删除所有的数据而且让 AUTO_INCREMENT 字段回到初始值,可以使用`truncate table`执行截断表操作,`truncate`的本质是删除原来的表并重新创建一个表,它的速度其实更快,因为不需要逐行删除数据。但是请大家记住一点,用`truncate table`删除数据是非常危险的,因为它会删除所有的数据,而且由于原来的表已经被删除了,要想恢复误删除的数据也会变得极为困难。 + +### update 操作 + +如果要修改表中的数据,可以使用`update`操作,它可以用来删除指定的行或所有的行。例如,我们将学生表中的“杨过”修改为“杨逍”,这里我们假设“杨过”的学号为`1001`,代码如下所示。 + +```SQL +update `tb_student` set `stu_name`='杨逍' where `stu_id`=1001; +``` + +注意上面 SQL 中的`where`子句,我们使用学号作为条件筛选出对应的学生,然后通过前面的赋值操作将其姓名修改为“杨逍”。这里为什么不直接使用姓名作为筛选条件,那是因为学生表中可能有多个名为“杨过”的学生,如果使用 stu_name 作为筛选条件,那么我们的`update`操作有可能会一次更新多条数据,这显然不是我们想要看到的。还有一个需要注意的地方是`update`操作中的`set`关键字,因为 SQL 中的`=`并不表示赋值,而是判断相等的运算符,只有出现在`set` 关键字后面的`=`,才具备赋值的能力。 + +如果要同时修改学生的姓名和生日,我们可以对上面的`update`语句稍作修改,如下所示。 + +```SQL +update `tb_student` set `stu_name`='杨逍', `stu_birth`='1975-12-29' where `stu_id`=1001; +``` + +`update`语句中也可以使用查询的方式获得数据并以此来更新指定的表数据,有兴趣的读者可以自行研究。在书写`update`语句时,通常都会有`where`子句,因为实际工作中几乎不太会用到更新全表的操作,这一点大家一定要注意。 + +### 完整的数据 + +下面我们给出完整的向 school 数据库的五张表中插入数据的 SQL。 + +```SQL +use `school`; + +-- 插入学院数据 +insert into `tb_college` + (`col_name`, `col_intro`) +values + ('计算机学院', '计算机学院1958年设立计算机专业,1981年建立计算机科学系,1998年设立计算机学院,2005年5月,为了进一步整合教学和科研资源,学校决定,计算机学院和软件学院行政班子合并统一运作、实行教学和学生管理独立运行的模式。 学院下设三个系:计算机科学与技术系、物联网工程系、计算金融系;两个研究所:图象图形研究所、网络空间安全研究院(2015年成立);三个教学实验中心:计算机基础教学实验中心、IBM技术中心和计算机专业实验中心。'), + ('外国语学院', '外国语学院设有7个教学单位,6个文理兼收的本科专业;拥有1个一级学科博士授予点,3个二级学科博士授予点,5个一级学科硕士学位授权点,5个二级学科硕士学位授权点,5个硕士专业授权领域,同时还有2个硕士专业学位(MTI)专业;有教职员工210余人,其中教授、副教授80余人,教师中获得中国国内外名校博士学位和正在职攻读博士学位的教师比例占专任教师的60%以上。'), + ('经济管理学院', '经济学院前身是创办于1905年的经济科;已故经济学家彭迪先、张与九、蒋学模、胡寄窗、陶大镛、胡代光,以及当代学者刘诗白等曾先后在此任教或学习。'); + +-- 插入学生数据 +insert into `tb_student` + (`stu_id`, `stu_name`, `stu_sex`, `stu_birth`, `stu_addr`, `col_id`) +values + (1001, '杨过', 1, '1990-3-4', '湖南长沙', 1), + (1002, '任我行', 1, '1992-2-2', '湖南长沙', 1), + (1033, '王语嫣', 0, '1989-12-3', '四川成都', 1), + (1572, '岳不群', 1, '1993-7-19', '陕西咸阳', 1), + (1378, '纪嫣然', 0, '1995-8-12', '四川绵阳', 1), + (1954, '林平之', 1, '1994-9-20', '福建莆田', 1), + (2035, '东方不败', 1, '1988-6-30', null, 2), + (3011, '林震南', 1, '1985-12-12', '福建莆田', 3), + (3755, '项少龙', 1, '1993-1-25', '四川成都', 3), + (3923, '杨不悔', 0, '1985-4-17', '四川成都', 3); + +-- 插入老师数据 +insert into `tb_teacher` + (`tea_id`, `tea_name`, `tea_title`, `col_id`) +values + (1122, '张三丰', '教授', 1), + (1133, '宋远桥', '副教授', 1), + (1144, '杨逍', '副教授', 1), + (2255, '范遥', '副教授', 2), + (3366, '韦一笑', default, 3); + +-- 插入课程数据 +insert into `tb_course` + (`cou_id`, `cou_name`, `cou_credit`, `tea_id`) +values + (1111, 'Python程序设计', 3, 1122), + (2222, 'Web前端开发', 2, 1122), + (3333, '操作系统', 4, 1122), + (4444, '计算机网络', 2, 1133), + (5555, '编译原理', 4, 1144), + (6666, '算法和数据结构', 3, 1144), + (7777, '经贸法语', 3, 2255), + (8888, '成本会计', 2, 3366), + (9999, '审计学', 3, 3366); + +-- 插入选课数据 +insert into `tb_record` + (`stu_id`, `cou_id`, `sel_date`, `score`) +values + (1001, 1111, '2017-09-01', 95), + (1001, 2222, '2017-09-01', 87.5), + (1001, 3333, '2017-09-01', 100), + (1001, 4444, '2018-09-03', null), + (1001, 6666, '2017-09-02', 100), + (1002, 1111, '2017-09-03', 65), + (1002, 5555, '2017-09-01', 42), + (1033, 1111, '2017-09-03', 92.5), + (1033, 4444, '2017-09-01', 78), + (1033, 5555, '2017-09-01', 82.5), + (1572, 1111, '2017-09-02', 78), + (1378, 1111, '2017-09-05', 82), + (1378, 7777, '2017-09-02', 65.5), + (2035, 7777, '2018-09-03', 88), + (2035, 9999, '2019-09-02', null), + (3755, 1111, '2019-09-02', null), + (3755, 8888, '2019-09-02', null), + (3755, 9999, '2017-09-01', 92); +``` + +> **注意**:上面的`insert`语句使用了批处理的方式来插入数据,这种做法插入数据的效率比较高。 + + + diff --git a/Day36-45/39.SQL详解之DQL.md b/Day36-45/39.SQL详解之DQL.md new file mode 100755 index 0000000..6e19638 --- /dev/null +++ b/Day36-45/39.SQL详解之DQL.md @@ -0,0 +1,448 @@ +## SQL详解之DQL + +接下来,我们利用之前创建的学校选课系统数据库,为大家讲解 DML 中的查询操作。无论对于开发人员还是数据分析师,查询都是非常重要的,它关系着我们能否从关系数据库中获取我们需要的数据。建议大家把上上一节课中建库建表的 DDL 以及 上一节课中插入数据的 DML 重新执行一次,确保表和数据跟没有问题再执行下面的操作。 + +```SQL +USE school; + +-- 查询所有学生的所有信息 +SELECT stu_id, + stu_name, + stu_sex, + stu_birth, + stu_addr, + col_id + FROM tb_student; + +-- 查询学生的学号、姓名和籍贯(投影和别名) +SELECT stu_id AS 学号, + stu_name AS 姓名, + stu_addr AS 籍贯 + FROM tb_student; + +-- 查询所有课程的名称及学分(投影和别名) +SELECT cou_name AS 课程名称, + cou_credit AS 学分 + FROM tb_course; + +-- 查询所有女学生的姓名和出生日期(数据筛选) +SELECT stu_name, + stu_birth + FROM tb_student + WHERE stu_sex = 0; + +-- 查询籍贯为“四川成都”的女学生的姓名和出生日期(数据筛选) +SELECT stu_name, + stu_birth + FROM tb_student + WHERE stu_sex = 0 + AND stu_addr = '四川成都'; + +-- 查询籍贯为“四川成都”或者性别是女的学生(数据筛选) +SELECT stu_name, + stu_birth + FROM tb_student + WHERE stu_sex = 0 + OR stu_addr = '四川成都'; + +-- 查询所有80后学生的姓名、性别和出生日期(数据筛选) +SELECT stu_name, + stu_sex, + stu_birth + FROM tb_student + WHERE '1980-1-1' <= stu_birth + AND stu_birth <= '1989-12-31'; + +SELECT stu_name, + stu_sex, + stu_birth + FROM tb_student + WHERE stu_birth BETWEEN '1980-1-1' AND '1989-12-31'; + +-- 查询学分大于2的课程的名称和学分(数据筛选) +SELECT cou_name, + cou_credit + FROM tb_course + WHERE cou_credit > 2; + +-- 查询学分是奇数的课程的名称和学分(数据筛选) +SELECT cou_name, + cou_credit + FROM tb_course + WHERE cou_credit MOD 2 <> 0; + +-- 查询选择选了1111的课程考试成绩在90分以上的学生学号(数据筛选) +SELECT stu_id + FROM tb_record + WHERE cou_id = 1111 + AND score > 90; + +-- 查询名字叫“杨过”的学生的姓名和性别(数据筛选) +SELECT stu_name AS 姓名, + CASE stu_sex WHEN 1 THEN '男' ELSE '女' END AS 性别 + FROM tb_student + WHERE stu_name = '杨过'; + +SELECT stu_name AS 姓名, + IF(stu_sex, '男', '女') AS 性别 + FROM tb_student + WHERE stu_name = '杨过'; + +-- 查询姓“杨”的学生姓名和性别(模糊匹配) +-- 通配符 % 匹配零个或任意多个字符 +SELECT stu_name AS 姓名, + CASE stu_sex WHEN 1 THEN '男' ELSE '女' END AS 性别 + FROM tb_student + WHERE stu_name LIKE '杨%'; + +-- 查询姓“杨”名字两个字的学生姓名和性别(模糊匹配) +-- 通过符 _ 匹配一个字符 +SELECT stu_name AS 姓名, + CASE stu_sex WHEN 1 THEN '男' ELSE '女' END AS 性别 + FROM tb_student + WHERE stu_name LIKE '杨_'; + +-- 查询姓“杨”名字三个字的学生姓名和性别(模糊匹配) +SELECT stu_name AS 姓名, + CASE stu_sex WHEN 1 THEN '男' ELSE '女' END AS 性别 + FROM tb_student + WHERE stu_name LIKE '杨__'; + +-- 查询学号最后一位是3的学生的学号和姓名(模糊匹配) +SELECT stu_id, + stu_name + FROM tb_student + WHERE stu_id LIKE '%3'; + +-- 查询名字中有“不”字或“嫣”字的学生的学号和姓名(模糊匹配和并集运算) +SELECT stu_id, + stu_name + FROM tb_student + WHERE stu_name LIKE '%不%' + OR stu_name LIKE '%嫣%'; + +SELECT stu_id, + stu_name + FROM tb_student + WHERE stu_name LIKE '%不%' + UNION +SELECT stu_id, + stu_name + FROM tb_student + WHERE stu_name LIKE '%嫣%'; + +-- 查询姓“杨”或姓“林”名字三个字的学生的学号和姓名(正则表达式模糊匹配) +SELECT stu_id, + stu_name + FROM tb_student + WHERE stu_name REGEXP '[林杨][\\u4e00-\\u9fa5]{2}'; + +-- 查询没有录入籍贯的学生姓名(空值处理) +SELECT stu_name + FROM tb_student + WHERE TRIM(stu_addr) = '' + OR stu_addr is null; + +-- 查询录入了籍贯的学生姓名(空值处理) +SELECT stu_name + FROM tb_student + WHERE TRIM(stu_addr) <> '' + AND stu_addr is not null; + +-- 查询学生选课的所有日期(去重) +SELECT DISTINCT sel_date + FROM tb_record; + +-- 查询学生的籍贯(去重) +SELECT DISTINCT stu_addr + FROM tb_student + WHERE TRIM(stu_addr) <> '' + AND stu_addr is not null; + +-- 查询男学生的姓名和生日按年龄从大到小排列(排序) +SELECT stu_name, + stu_birth + FROM tb_student + WHERE stu_sex = 1 + ORDER BY stu_birth ASC; + +-- 补充:将上面的生日换算成年龄(日期函数、数值函数) +SELECT stu_name AS 姓名, + FLOOR(DATEDIFF(CURDATE(), stu_birth) / 365) AS 年龄 + FROM tb_student + WHERE stu_sex = 1 + ORDER BY 年龄 DESC; + +-- 查询年龄最大的学生的出生日期(聚合函数) +SELECT MIN(stu_birth) + FROM tb_student; + +-- 查询年龄最小的学生的出生日期(聚合函数) +SELECT MAX(stu_birth) + FROM tb_student; + +-- 查询编号为1111的课程考试成绩的最高分(聚合函数) +SELECT MAX(score) + FROM tb_record + WHERE cou_id = 1111; + +-- 查询学号为1001的学生考试成绩的最低分、最高分、平均分、标准差、方差(聚合函数) +SELECT MIN(score) AS 最低分, + MAX(score) AS 最高分, + ROUND(AVG(score), 1) AS 平均分, + STDDEV(score) AS 标准差, + VARIANCE(score) AS 方差 + FROM tb_record + WHERE stu_id = 1001; + +-- 查询学号为1001的学生考试成绩的平均分,如果有null值,null值算0分(聚合函数) +SELECT ROUND(SUM(score) / COUNT(*), 1) AS 平均分 + FROM tb_record + WHERE stu_id = 1001; + +-- 查询男女学生的人数(分组和聚合函数) +SELECT CASE stu_sex WHEN 1 THEN '男' ELSE '女' END AS 性别, + COUNT(*) AS 人数 + FROM tb_student + GROUP BY stu_sex; + +-- 查询每个学院学生人数(分组和聚合函数) +SELECT col_id AS 学院编号, + COUNT(*) AS 人数 + FROM tb_student + GROUP BY col_id + WITH ROLLUP; + +-- 查询每个学院男女学生人数(分组和聚合函数) +SELECT col_id AS 学院编号, + CASE stu_sex WHEN 1 THEN '男' ELSE '女' END AS 性别, + COUNT(*) AS 人数 + FROM tb_student + GROUP BY col_id, stu_sex; + +-- 查询每个学生的学号和平均成绩(分组和聚合函数) +SELECT stu_id AS 学号, + ROUND(AVG(score), 1) AS 平均分 + FROM tb_record + GROUP BY stu_id; + +-- 查询平均成绩大于等于90分的学生的学号和平均成绩(分组后的数据筛选) +SELECT stu_id AS 学号, + ROUND(AVG(score), 1) AS 平均分 + FROM tb_record + GROUP BY stu_id +HAVING 平均分 >= 90; + +-- 查询1111、2222、3333三门课程平均成绩大于等于90分的学生的学号和平均成绩(分组前后的数据筛选) +SELECT stu_id AS 学号, + ROUND(AVG(score), 1) AS 平均分 + FROM tb_record + WHERE cou_id in (1111, 2222, 3333) + GROUP BY stu_id +HAVING 平均分 >= 90 + ORDER BY 平均分 ASC; + +-- 查询年龄最大的学生的姓名(子查询) +SELECT stu_name + FROM tb_student + WHERE stu_birth = (SELECT MIN(stu_birth) + FROM tb_student); + +-- 查询选了两门以上的课程的学生姓名(子查询和集合运算) +SELECT stu_name + FROM tb_student + WHERE stu_id in (SELECT stu_id + FROM tb_record + GROUP BY stu_id + HAVING COUNT(*) > 2); + +-- 查询学生的姓名、生日和所在学院名称(表连接) +SELECT stu_name, + stu_birth, + col_name + FROM tb_student AS t1, tb_college AS t2 + WHERE t1.col_id = t2.col_id; + +SELECT stu_name, + stu_birth, + col_name + FROM tb_student INNER JOIN tb_college + ON tb_student.col_id = tb_college.col_id; + +SELECT stu_name, + stu_birth, + col_name + FROM tb_student NATURAL JOIN tb_college; + +SELECT stu_name, + stu_birth, + col_name + FROM tb_student CROSS JOIN tb_college; + +-- 查询学生姓名、课程名称以及成绩(表连接) +SELECT stu_name, + cou_name, + score + FROM tb_student, tb_course, tb_record + WHERE tb_student.stu_id = tb_record.stu_id + AND tb_course.cou_id = tb_record.cou_id + AND score is not null; + +SELECT stu_name, + cou_name, + score + FROM tb_student + INNER JOIN tb_record + ON tb_student.stu_id = tb_record.stu_id + INNER JOIN tb_course + ON tb_course.cou_id = tb_record.cou_id + WHERE score is not null; + +SELECT stu_name, + cou_name, + score + FROM tb_student + NATURAL JOIN tb_record + NATURAL JOIN tb_course + WHERE score is not null; + +-- 补充:上面的查询结果取前5条数据(分页查询) +SELECT stu_name, + cou_name, + score + FROM tb_student + NATURAL JOIN tb_record + NATURAL JOIN tb_course + WHERE score is not null + ORDER BY cou_id ASC, score DESC + LIMIT 5; + +-- 补充:上面的查询结果取第6-10条数据(分页查询) +SELECT stu_name, + cou_name, + score + FROM tb_student + NATURAL JOIN tb_record + NATURAL JOIN tb_course + WHERE score is not null + ORDER BY cou_id ASC, score DESC + LIMIT 5 +OFFSET 5; + +-- 补充:上面的查询结果取第11-15条数据(分页查询) +SELECT stu_name, + cou_name, + score + FROM tb_student + NATURAL JOIN tb_record + NATURAL JOIN tb_course + WHERE score is not null + ORDER BY cou_id ASC, score DESC + LIMIT 10, 5; + +-- 查询选课学生的姓名和平均成绩(子查询和表连接) +-- Error Code: 1248. Every derived table must have its own alias +SELECT stu_name, + avg_score + FROM tb_student + NATURAL JOIN (SELECT stu_id, + ROUND(AVG(score), 1) AS avg_score + FROM tb_record + GROUP BY stu_id) as tmp; + +-- 查询学生的姓名和选课的数量(子查询和表连接) +SELECT stu_name, + total + FROM tb_student + NATURAL JOIN (SELECT stu_id, + COUNT(*) AS total + FROM tb_record + GROUP BY stu_id) as tmp; + +-- 查询每个学生的姓名和选课数量(子查询和左外连接) +SELECT stu_name AS 姓名, + COALESCE(total, 0) AS 选课数量 + FROM tb_student AS t1 + LEFT JOIN (SELECT stu_id, + COUNT(*) AS total + FROM tb_record + GROUP BY stu_id) AS t2 + ON t1.stu_id = t2.stu_id; +``` + +有几个地方需要加以说明: + +1. MySQL目前的版本不支持全外连接,上面我们通过`union`操作,将左外连接和右外连接的结果求并集实现全外连接的效果。大家可以通过下面的图来加深对连表操作的认识。 + + + +2. MySQL 中支持多种类型的运算符,包括:算术运算符(`+`、`-`、`*`、`/`、`%`)、比较运算符(`=`、`<>`、`<=>`、`<`、`<=`、`>`、`>=`、`BETWEEN...AND..`.、`IN`、`IS NULL`、`IS NOT NULL`、`LIKE`、`RLIKE`、`REGEXP`)、逻辑运算符(`NOT`、`AND`、`OR`、`XOR`)和位运算符(`&`、`|`、`^`、`~`、`>>`、`<<`),我们可以在 DML 中使用这些运算符处理数据。 + +3. 在查询数据时,可以在`SELECT`语句及其子句(如`WHERE`子句、`ORDER BY`子句、`HAVING`子句等)中使用函数,这些函数包括字符串函数、数值函数、时间日期函数、流程函数等,如下面的表格所示。 + + 常用字符串函数。 + + | 函数 | 功能 | + | --------------------------- | ----------------------------------------------------- | + | `CONCAT` | 将多个字符串连接成一个字符串 | + | `FORMAT` | 将数值格式化成字符串并指定保留几位小数 | + | `FROM_BASE64` / `TO_BASE64` | BASE64解码/编码 | + | `BIN` / `OCT` / `HEX` | 将数值转换成二进制/八进制/十六进制字符串 | + | `LOCATE` | 在字符串中查找一个子串的位置 | + | `LEFT` / `RIGHT` | 返回一个字符串左边/右边指定长度的字符 | + | `LENGTH` / `CHAR_LENGTH` | 返回字符串的长度以字节/字符为单位 | + | `LOWER` / `UPPER` | 返回字符串的小写/大写形式 | + | `LPAD` / `RPAD` | 如果字符串的长度不足,在字符串左边/右边填充指定的字符 | + | `LTRIM` / `RTRIM` | 去掉字符串前面/后面的空格 | + | `ORD` / `CHAR` | 返回字符对应的编码/返回编码对应的字符 | + | `STRCMP` | 比较字符串,返回-1、0、1分别表示小于、等于、大于 | + | `SUBSTRING` | 返回字符串指定范围的子串 | + + 常用数值函数。 + + | 函数 | 功能 | + | -------------------------------------------------------- | ---------------------------------- | + | `ABS` | 返回一个数的绝度值 | + | `CEILING` / `FLOOR` | 返回一个数上取整/下取整的结果 | + | `CONV` | 将一个数从一种进制转换成另一种进制 | + | `CRC32` | 计算循环冗余校验码 | + | `EXP` / `LOG` / `LOG2` / `LOG10` | 计算指数/对数 | + | `POW` | 求幂 | + | `RAND` | 返回[0,1)范围的随机数 | + | `ROUND` | 返回一个数四舍五入后的结果 | + | `SQRT` | 返回一个数的平方根 | + | `TRUNCATE` | 截断一个数到指定的精度 | + | `SIN` / `COS` / `TAN` / `COT` / `ASIN` / `ACOS` / `ATAN` | 三角函数 | + + 常用时间日期函数。 + + | 函数 | 功能 | + | ----------------------------------------- | ------------------------------------- | + | `CURDATE` / `CURTIME` / `NOW` | 获取当前日期/时间/日期和时间 | + | `ADDDATE` / `SUBDATE` | 将两个日期表达式相加/相减并返回结果 | + | `DATE` / `TIME` | 从字符串中获取日期/时间 | + | `YEAR` / `MONTH` / `DAY` | 从日期中获取年/月/日 | + | `HOUR` / `MINUTE` / `SECOND` | 从时间中获取时/分/秒 | + | `DATEDIFF` / `TIMEDIFF` / `TIMESTAMPDIFF` | 返回两个时间日期表达式相差多少天/小时 | + | `MAKEDATE` / `MAKETIME` | 制造一个日期/时间 | + + 常用流程控制函数。 + + | 函数 | 功能 | + | -------- | ------------------------------------------------ | + | `IF` | 根据条件是否成立返回不同的值 | + | `IFNULL` | 如果为NULL则返回指定的值否则就返回本身 | + | `NULLIF` | 两个表达式相等就返回NULL否则返回第一个表达式的值 | + + 其他常用函数。 + + | 函数 | 功能 | + | -------------------------- | ----------------------------- | + | `MD5` / `SHA1` / `SHA2` | 返回字符串对应的哈希摘要 | + | `CHARSET` / `COLLATION` | 返回字符集/校对规则 | + | `USER` / `CURRENT_USER` | 返回当前用户 | + | `DATABASE` | 返回当前数据库名 | + | `VERSION` | 返回当前数据库版本 | + | `FOUND_ROWS` / `ROW_COUNT` | 返回查询到的行数/受影响的行数 | + | `LAST_INSERT_ID` | 返回最后一个自增主键的值 | + | `UUID` / `UUID_SHORT` | 返回全局唯一标识符 | diff --git a/Day36-45/40.SQL详解之DCL.md b/Day36-45/40.SQL详解之DCL.md new file mode 100755 index 0000000..e3bb186 --- /dev/null +++ b/Day36-45/40.SQL详解之DCL.md @@ -0,0 +1,74 @@ +## SQL详解之DCL + +数据库服务器通常包含了非常重要的数据,可以通过访问控制来确保这些数据的安全,而 DCL 就是解决这一问题的,它可以为指定的用户授予访问权限或者从指定用户处召回指定的权限。DCL 对数据库管理员来说非常重要,因为用户权限的管理关系到数据库的安全。简单的说,我们可以通过 DCL 允许受信任的用户访问数据库,阻止不受信任的用户访问数据库,同时还可以通过 DCL 将每个访问者的的权限最小化(让访问者的权限刚刚够用)。 + +### 创建用户 + +我们可以使用下面的 SQL 来创建一个用户并为其指定访问口令。 + +```SQL +create user 'wangdachui'@'%' identified by 'Wang.618'; +``` + +上面的 SQL 创建了名为 wangdachui 的用户,它的访问口令是 Wang.618,该用户可以从任意主机访问数据库服务器,因为 @ 后面使用了可以表示任意多个字符的通配符 %。如果要限制 wangdachui 这个用户只能从 192.168.0.x 这个网段的主机访问数据库服务器,可以按照下面的方式来修改 SQL 语句。 + +```SQL +drop user if exists 'wangdachui'@'%'; + +create user 'wangdachui'@'192.168.0.%' identified by 'Wang.618'; +``` + +此时,如果我们使用 wangdachui 这个账号访问数据库服务器,我们几乎不能做任何操作,因为该账号没有任何操作权限。 + +### 授予权限 + +我们用下面的语句为 wangdachui 授予查询 school 数据库学院表(`tb_college`)的权限。 + +```SQL +grant select on `school`.`tb_college` to 'wangdachui'@'192.168.0.%'; +``` + +我们也可以让 wangdachui 对 school 数据库的所有对象都具有查询权限,代码如下所示。 + +```SQL +grant select on `school`.* to 'wangdachui'@'192.168.0.%'; +``` + +如果我们希望 wangdachui 还有 insert、delete 和 update 权限,可以使用下面的方式进行操作。 + +```SQL +grant insert, delete, update on `school`.* to 'wangdachui'@'192.168.0.%'; +``` + +如果我们还想授予 wangdachui 执行 DDL 的权限,可以使用如下所示的 SQL。 + +```SQL +grant create, drop, alter on `school`.* to 'wangdachui'@'192.168.0.%'; +``` + +如果我们希望 wangdachui 账号对所有数据库的所有对象都具备所有的操作权限,可以执行如下所示的操作,但是一般情况下,我们不会这样做,因为我们之前说过,权限刚刚够用就行,一个普通的账号不应该拥有这么大的权限。 + +```SQL +grant all privileges on *.* to 'wangdachui'@'192.168.0.%'; +``` + +### 召回权限 + +如果要召回 wangdachui 对 school 数据库的 insert、delete 和 update 权限,可以使用下面的操作。 + +```SQL +revoke insert, delete, update on `school`.* from 'wangdachui'@'192.168.0.%'; +``` + +如果要召回所有的权限,可以按照如下所示的方式进行操作。 + +```SQL +revoke all privileges on *.* from 'wangdachui'@'192.168.0.%'; +``` + +需要说明的是,由于数据库可能会缓存用户的权限,可以在授予或召回权限后执行下面的语句使新的权限即时生效。 + +```SQL +flush privileges; +``` + diff --git a/Day36-45/41.MySQL新特性.md b/Day36-45/41.MySQL新特性.md new file mode 100755 index 0000000..d1933f4 --- /dev/null +++ b/Day36-45/41.MySQL新特性.md @@ -0,0 +1,196 @@ +## MySQL新特性 + +### JSON类型 + +很多开发者在使用关系型数据库做数据持久化的时候,常常感到结构化的存储缺乏灵活性,因为必须事先设计好所有的列以及对应的数据类型。在业务发展和变化的过程中,如果需要修改表结构,这绝对是比较麻烦和难受的事情。从 MySQL 5.7 版本开始,MySQL引入了对 JSON 数据类型的支持(MySQL 8.0 解决了 JSON 的日志性能瓶颈问题),用好 JSON 类型,其实就是打破了关系型数据库和非关系型数据库之间的界限,为数据持久化操作带来了更多的便捷。 + +JSON 类型主要分为 JSON 对象和 JSON数组两种,如下所示。 + +1. JSON 对象 + +```JSON +{"name": "骆昊", "tel": "13122335566", "QQ": "957658"} +``` + +2. JSON 数组 + +```JSON +[1, 2, 3] +``` + +```JSON +[{"name": "骆昊", "tel": "13122335566"}, {"name": "王大锤", "QQ": "123456"}] +``` + +哪些地方需要用到JSON类型呢?举一个简单的例子,现在很多产品的用户登录都支持多种方式,例如手机号、微信、QQ、新浪微博等,但是一般情况下我们又不会要求用户提供所有的这些信息,那么用传统的设计方式,就需要设计多个列来对应多种登录方式,可能还需要允许这些列存在空值,这显然不是很好的选择;另一方面,如果产品又增加了一种登录方式,那么就必然要修改之前的表结构,这就更让人痛苦了。但是,有了 JSON 类型,刚才的问题就迎刃而解了,我们可以做出如下所示的设计。 + +```SQL +create table `tb_test` +( +`user_id` bigint unsigned, +`login_info` json, +primary key (`user_id`) +) engine=innodb; + +insert into `tb_test` values + (1, '{"tel": "13122335566", "QQ": "654321", "wechat": "jackfrued"}'), + (2, '{"tel": "13599876543", "weibo": "wangdachui123"}'); +``` + +如果要查询用户的手机和微信号,可以用如下所示的 SQL 语句。 + +```SQL +select + `user_id`, + json_unquote(json_extract(`login_info`, '$.tel')) as 手机号, + json_unquote(json_extract(`login_info`, '$.wechat')) as 微信 +from `tb_test`; +``` + +``` ++---------+-------------+-----------+ +| user_id | 手机号 | 微信 | ++---------+-------------+-----------+ +| 1 | 13122335566 | jackfrued | +| 2 | 13599876543 | NULL | ++---------+-------------+-----------+ +``` + +因为支持 JSON 类型,MySQL 也提供了配套的处理 JSON 数据的函数,就像上面用到的`json_extract`和`json_unquote`。当然,上面的 SQL 还有更为便捷的写法,如下所示。 + +```SQL +select + `user_id`, + `login_info` ->> '$.tel' as 手机号, + `login_info` ->> '$.wechat' as 微信 +from `tb_test`; +``` + +再举个例子,如果我们的产品要实现用户画像功能(给用户打标签),然后基于用户画像给用户推荐平台的服务或消费品之类的东西,我们也可以使用 JSON 类型来保存用户画像数据,示意代码如下所示。 + +创建画像标签表。 + +```SQL +create table `tb_tags` +( +`tag_id` int unsigned not null comment '标签ID', +`tag_name` varchar(20) not null comment '标签名', +primary key (`tag_id`) +) engine=innodb; + +insert into `tb_tags` (`tag_id`, `tag_name`) +values + (1, '70后'), + (2, '80后'), + (3, '90后'), + (4, '00后'), + (5, '爱运动'), + (6, '高学历'), + (7, '小资'), + (8, '有房'), + (9, '有车'), + (10, '爱看电影'), + (11, '爱网购'), + (12, '常点外卖'); +``` + +为用户打标签。 + +```SQL +create table `tb_users_tags` +( +`user_id` bigint unsigned not null comment '用户ID', +`user_tags` json not null comment '用户标签' +) engine=innodb; + +insert into `tb_users_tags` values + (1, '[2, 6, 8, 10]'), + (2, '[3, 10, 12]'), + (3, '[3, 8, 9, 11]'); +``` + +接下来,我们通过一组查询来了解 JSON 类型的巧妙之处。 + +1. 查询爱看电影(有`10`这个标签)的用户ID。 + + ```SQL + select `user_id` from `tb_users_tags` where 10 member of (`user_tags`->'$'); + ``` + +2. 查询爱看电影(有`10`这个标签)的80后(有`2`这个标签)用户ID。 + + ```SQL + select `user_id` from `tb_users_tags` where json_contains(`user_tags`->'$', '[2, 10]'); + ``` + +3. 查询爱看电影或80后或90后的用户ID。 + + ```SQL + select `user_id` from `tb_users_tags` where json_overlaps(user_tags->'$', '[2, 3, 10]'); + ``` + +> **说明**:上面的查询用到了`member of`谓词和两个 JSON 函数,`json_contains`可以检查 JSON 数组是否包含了指定的元素,而`json_overlaps`可以检查 JSON 数组是否与指定的数组有重叠部分。 + +### 窗口函数 + +MySQL 从8.0开始支持窗口函数,大多数商业数据库和一些开源数据库早已提供了对窗口函数的支持,有的也将其称之为 OLAP(联机分析和处理)函数,听名字就知道跟统计和分析相关。为了帮助大家理解窗口函数,我们先说说窗口的概念。 + +窗口可以理解为记录的集合,窗口函数也就是在满足某种条件的记录集合上执行的特殊函数,对于每条记录都要在此窗口内执行函数。窗口函数和我们上面讲到的聚合函数比较容易混淆,二者的区别主要在于聚合函数是将多条记录聚合为一条记录,窗口函数是每条记录都会执行,执行后记录条数不会变。窗口函数不仅仅是几个函数,它是一套完整的语法,函数只是该语法的一部分,基本语法如下所示: + +```SQL +<窗口函数> over (partition by <用于分组的列名> order by <用于排序的列名> rows between ... and ...) +<窗口函数> over (partition by <用于分组的列名> order by <用于排序的列名> range between ... and ...) +``` + +上面语法中,窗口函数的位置可以放以下两种函数: + +1. 专用窗口函数,包括:`lead`、`lag`、`first_value`、`last_value`、`rank`、`dense_rank`和`row_number`等。 +2. 聚合函数,包括:`sum`、`avg`、`max`、`min`和`count`等。 + +下面为大家举几个使用窗口函数的简单例子,我们直接使用上一课创建的 hrs 数据库。 + +例子1:查询按月薪从高到低排在第4到第6名的员工的姓名和月薪。 + +```SQL +select * from ( + select + `ename`, `sal`, + row_number() over (order by `sal` desc) as `rank` + from `tb_emp` +) `temp` where `rank` between 4 and 6; +``` + +> **说明**:上面使用的函数`row_number()`可以为每条记录生成一个行号,在实际工作中可以根据需要将其替换为`rank()`或`dense_rank()`函数,三者的区别可以参考官方文档或阅读[《通俗易懂的学会:SQL窗口函数》](https://zhuanlan.zhihu.com/p/92654574)进行了解。在MySQL 8以前的版本,我们可以通过下面的方式来完成类似的操作。 +> +> ```SQL +> select `rank`, `ename`, `sal` from ( +> select @a:=@a+1 as `rank`, `ename`, `sal` +> from `tb_emp`, (select @a:=0) as t1 order by `sal` desc +> ) as `temp` where `rank` between 4 and 6; +> ``` + +例子2:查询每个部门月薪最高的两名的员工的姓名和部门名称。 + +```SQL +select `ename`, `sal`, `dname` +from ( + select + `ename`, `sal`, `dno`, + rank() over (partition by `dno` order by `sal` desc) as `rank` + from `tb_emp` +) as `temp` natural join `tb_dept` where `rank`<=2; +``` + +> 说明:在MySQL 8以前的版本,我们可以通过下面的方式来完成类似的操作。 +> +> ```SQL +> select `ename`, `sal`, `dname` from `tb_emp` as `t1` +natural join `tb_dept` +where ( + select count(*) from `tb_emp` as `t2` + where `t1`.`dno`=`t2`.`dno` and `t2`.`sal`>`t1`.`sal` +)<2 order by `dno` asc, `sal` desc; +> ``` + +### 公用表表达式(CTE) + diff --git a/Day36-45/42.视图、函数和过程.md b/Day36-45/42.视图、函数和过程.md new file mode 100755 index 0000000..1c45b2d --- /dev/null +++ b/Day36-45/42.视图、函数和过程.md @@ -0,0 +1,336 @@ +## 视图、函数和过程 + +为了讲解视图、函数和过程,我们首先用下面的 DDL 和 DML 创建名为 hrs 的数据库并为其二维表添加如下所示的数据。 + +```SQL +-- 创建名为hrs的数据库并指定默认的字符集 +create database `hrs` default charset utf8mb4; + +-- 切换到hrs数据库 +use `hrs`; + +-- 创建部门表 +create table `tb_dept` +( +`dno` int not null comment '编号', +`dname` varchar(10) not null comment '名称', +`dloc` varchar(20) not null comment '所在地', +primary key (`dno`) +); + +-- 插入4个部门 +insert into `tb_dept` values + (10, '会计部', '北京'), + (20, '研发部', '成都'), + (30, '销售部', '重庆'), + (40, '运维部', '深圳'); + +-- 创建员工表 +create table `tb_emp` +( +`eno` int not null comment '员工编号', +`ename` varchar(20) not null comment '员工姓名', +`job` varchar(20) not null comment '员工职位', +`mgr` int comment '主管编号', +`sal` int not null comment '员工月薪', +`comm` int comment '每月补贴', +`dno` int not null comment '所在部门编号', +primary key (`eno`), +constraint `fk_emp_mgr` foreign key (`mgr`) references tb_emp (`eno`), +constraint `fk_emp_dno` foreign key (`dno`) references tb_dept (`dno`) +); + +-- 插入14个员工 +insert into `tb_emp` values + (7800, '张三丰', '总裁', null, 9000, 1200, 20), + (2056, '乔峰', '分析师', 7800, 5000, 1500, 20), + (3088, '李莫愁', '设计师', 2056, 3500, 800, 20), + (3211, '张无忌', '程序员', 2056, 3200, null, 20), + (3233, '丘处机', '程序员', 2056, 3400, null, 20), + (3251, '张翠山', '程序员', 2056, 4000, null, 20), + (5566, '宋远桥', '会计师', 7800, 4000, 1000, 10), + (5234, '郭靖', '出纳', 5566, 2000, null, 10), + (3344, '黄蓉', '销售主管', 7800, 3000, 800, 30), + (1359, '胡一刀', '销售员', 3344, 1800, 200, 30), + (4466, '苗人凤', '销售员', 3344, 2500, null, 30), + (3244, '欧阳锋', '程序员', 3088, 3200, null, 20), + (3577, '杨过', '会计', 5566, 2200, null, 10), + (3588, '朱九真', '会计', 5566, 2500, null, 10); +``` + +### 视图 + +视图是关系型数据库中将一组查询指令构成的结果集组合成可查询的数据表的对象。简单的说,视图就是虚拟的表,但与数据表不同的是,数据表是一种实体结构,而视图是一种虚拟结构,你也可以将视图理解为保存在数据库中被赋予名字的 SQL 语句。 + +使用视图可以获得以下好处: + +1. 可以将实体数据表隐藏起来,让外部程序无法得知实际的数据结构,让访问者可以使用表的组成部分而不是整个表,降低数据库被攻击的风险。 +2. 在大多数的情况下视图是只读的(更新视图的操作通常都有诸多的限制),外部程序无法直接透过视图修改数据。 +3. 重用 SQL 语句,将高度复杂的查询包装在视图表中,直接访问该视图即可取出需要的数据;也可以将视图视为数据表进行连接查询。 +4. 视图可以返回与实体数据表不同格式的数据,在创建视图的时候可以对数据进行格式化处理。 + +创建视图。 + +```SQL +create view `vw_emp_simple` +as +select `eno`, + `ename`, + `job`, + `dno` + from `tb_emp`; +``` + +> **提示**:因为视图不包含数据,所以每次使用视图时,都必须执行查询以获得数据,如果你使用了连接查询、嵌套查询创建了较为复杂的视图,你可能会发现查询性能下降得很厉害。因此,在使用复杂的视图前,应该进行测试以确保其性能能够满足应用的需求。 + +有了上面的视图,我们就可以使用之前讲过的 DCL, 限制某些用户只能从视图中获取员工信息,这样员工表中的工资(`sal`)、补贴(`comm`)等敏感字段便不会暴露给用户。下面的代码演示了如何从视图中获取数据。 + +```SQL +select * from `vw_emp_simple`; +``` + +查询结果: + +``` ++------+-----------+--------------+-----+ +| eno | ename | job | dno | ++------+-----------+--------------+-----+ +| 1359 | 胡二刀 | 销售员 | 30 | +| 2056 | 乔峰 | 分析师 | 20 | +| 3088 | 李莫愁 | 设计师 | 20 | +| 3211 | 张无忌 | 程序员 | 20 | +| 3233 | 丘处机 | 程序员 | 20 | +| 3244 | 欧阳锋 | 程序员 | 20 | +| 3251 | 张翠山 | 程序员 | 20 | +| 3344 | 黄蓉 | 销售主管 | 30 | +| 3577 | 杨过 | 会计 | 10 | +| 3588 | 朱九真 | 会计 | 10 | +| 4466 | 苗人凤 | 销售员 | 30 | +| 5234 | 郭靖 | 出纳 | 10 | +| 5566 | 宋远桥 | 会计师 | 10 | +| 7800 | 张三丰 | 总裁 | 20 | ++------+-----------+--------------+-----+ +``` + +既然视图是一张虚拟的表,那么视图的中的数据可以更新吗?视图的可更新性要视具体情况而定,以下类型的视图是不能更新的: + +1. 使用了聚合函数(`SUM`、`MIN`、`MAX`、`AVG`、`COUNT`等)、`DISTINCT`、`GROUP BY`、`HAVING`、`UNION`或者`UNION ALL`的视图。 +2. `SELECT`中包含了子查询的视图。 +3. `FROM`子句中包含了一个不能更新的视图的视图。 +4. `WHERE`子句的子查询引用了`FROM`子句中的表的视图。 + +删除视图。 + +```SQL +drop view if exists `vw_emp_simple`; +``` + +> **说明**:如果希望更新视图,可以先用上面的命令删除视图,也可以通过`create or replace view`来更新视图。 + +视图的规则和限制。 + +1. 视图可以嵌套,可以利用从其他视图中检索的数据来构造一个新的视图。视图也可以和表一起使用。 +2. 创建视图时可以使用`order by`子句,但如果从视图中检索数据时也使用了`order by`,那么该视图中原先的`order by`会被覆盖。 +3. 视图无法使用索引,也不会激发触发器(实际开发中因为性能等各方面的考虑,通常不建议使用触发器,所以我们也不对这个概念进行介绍)的执行。 + +### 函数 + +MySQL 中的函数跟 Python 中的函数大同小异,因为函数都是用来封装功能上相对独立且会被重复使用的代码的。如果非要找出一些差别来,那么 MySQL 中的函数是可以执行 SQL 语句的。下面的例子,我们通过自定义函数实现了截断超长字符串的功能。 + +```SQL +delimiter $$ + +create function fn_truncate_string( + content varchar(10000), + max_length int unsigned +) returns varchar(10000) no sql +begin + declare result varchar(10000) default content; + if char_length(content) > max_length then + set result = left(content, max_length); + set result = concat(result, '……'); + end if; + return result; +end $$ + +delimiter ; +``` + +> **说明1**:函数声明后面的`no sql`是声明函数体并没有使用 SQL 语句;如果函数体中需要通过 SQL 读取数据,需要声明为`reads sql data`。 +> +> **说明2**:定义函数前后的`delimiter`命令是为了修改终止符(定界符),因为函数体中的语句都是用`;`表示结束,如果不重新定义定界符,那么遇到的`;`的时候代码就会被截断执行,显然这不是我们想要的效果。 + +在查询中调用自定义函数。 + +```SQL +select fn_truncate_string('和我在成都的街头走一走,直到所有的灯都熄灭了也不停留', 10) as short_string; +``` + +``` ++--------------------------------------+ +| short_string | ++--------------------------------------+ +| 和我在成都的街头走一…… | ++--------------------------------------+ +``` + +### 过程 + +过程(又称存储过程)是事先编译好存储在数据库中的一组 SQL 的集合,调用过程可以简化应用程序开发人员的工作,减少与数据库服务器之间的通信,对于提升数据操作的性能也是有帮助的。其实迄今为止,我们使用的 SQL 语句都是针对一个或多个表的单条语句,但在实际开发中经常会遇到某个操作需要多条 SQL 语句才能完成的情况。例如,电商网站在受理用户订单时,需要做以下一系列的处理。 + +1. 通过查询来核对库存中是否有对应的物品以及库存是否充足。 +2. 如果库存有物品,需要锁定库存以确保这些物品不再卖给别人, 并且要减少可用的物品数量以反映正确的库存量。 +3. 如果库存不足,可能需要进一步与供应商进行交互或者至少产生一条系统提示消息。 +4. 不管受理订单是否成功,都需要产生流水记录,而且需要给对应的用户产生一条通知信息。 + +我们可以通过过程将复杂的操作封装起来,这样不仅有助于保证数据的一致性,而且将来如果业务发生了变动,只需要调整和修改过程即可。对于调用过程的用户来说,过程并没有暴露数据表的细节,而且执行过程比一条条的执行一组 SQL 要快得多。 + +下面的过程实现 hrs 数据库中员工工资的普调,具体的规则是:`10`部门的员工薪资上浮`300`, `20`部门的员工薪资上浮`800`,`30`部门的员工薪资上浮`500`。 + +```SQL +delimiter $$ + +create procedure sp_upgrade_salary() +begin + declare flag boolean default 1; + -- 定义一个异常处理器 + declare continue handler for sqlexception set flag=0; + + -- 开启事务环境 + start transaction; + + update tb_emp set sal=sal+300 where dno=10; + update tb_emp set sal=sal+800 where dno=20; + update tb_emp set sal=sal+500 where dno=30; + + -- 提交或回滚事务 + if flag then + commit; + else + rollback; + end if; +end $$ + +delimiter ; +``` + +> **说明**:上面的过程代码中使用了`start transaction`来开启事务环境,关于事务,在本课的最后有一个简单的介绍。为了确定代码中是否发生异常,从而提交或回滚事务,上面的过程中定义了一个名为`flag`的变量和一个异常处理器,如果发生了异常,`flag`将会被赋值为`0`,后面的分支结构会根据`flag`的值来决定是执行`commit`,还是执行`rollback`。 + +调用过程。 + +```SQL +call sp_upgrade_salary(); +``` + +删除过程。 + +```SQL +drop procedure if exists sp_upgrade_salary; +``` + +在过程中,我们可以定义变量、条件,可以使用分支和循环语句,可以通过游标操作查询结果,还可以使用事件调度器,这些内容我们暂时不在此处进行介绍。虽然我们说了很多过程的好处,但是在实际开发中,如果频繁的使用过程并将大量复杂的运算放到过程中,会给据库服务器造成巨大的压力,而数据库往往都是性能瓶颈所在,使用过程无疑是雪上加霜的操作。所以,对于互联网产品开发,我们一般建议让数据库只做好存储,复杂的运算和处理交给应用服务器上的程序去完成,如果应用服务器变得不堪重负了,我们可以比较容易的部署多台应用服务器来分摊这些压力。 + +如果大家对上面讲到的视图、函数、过程包括我们没有讲到的触发器这些知识有兴趣,建议大家阅读 MySQL 的入门读物[《MySQL必知必会》](https://item.jd.com/12818982.html)进行一般性了解即可,因为这些知识点在大家将来的工作中未必用得上,学了也可能仅仅是为了应付面试而已。 + +### 其他内容 + +#### 范式理论 + +范式理论是设计关系型数据库中二维表的指导思想。 + +1. 第一范式:数据表的每个列的值域都是由原子值组成的,不能够再分割。 +2. 第二范式:数据表里的所有数据都要和该数据表的键(主键与候选键)有完全依赖关系。 +3. 第三范式:所有非键属性都只和候选键有相关性,也就是说非键属性之间应该是独立无关的。 + +> **说明**:实际工作中,出于效率的考虑,我们在设计表时很有可能做出反范式设计,即故意降低方式级别,增加冗余数据来获得更好的操作性能。 + +#### 数据完整性 + +1. 实体完整性 - 每个实体都是独一无二的 + + - 主键(`primary key`) / 唯一约束(`unique`) +2. 引用完整性(参照完整性)- 关系中不允许引用不存在的实体 + + - 外键(`foreign key`) +3. 域(domain)完整性 - 数据是有效的 + - 数据类型及长度 + + - 非空约束(`not null`) + + - 默认值约束(`default`) + + - 检查约束(`check`) + + > **说明**:在 MySQL 8.x 以前,检查约束并不起作用。 + +#### 数据一致性 + +1. 事务:一系列对数据库进行读/写的操作,这些操作要么全都成功,要么全都失败。 + +2. 事务的 ACID 特性 + - 原子性:事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行 + - 一致性:事务应确保数据库的状态从一个一致状态转变为另一个一致状态 + - 隔离性:多个事务并发执行时,一个事务的执行不应影响其他事务的执行 + - 持久性:已被提交的事务对数据库的修改应该永久保存在数据库中 + +3. MySQL 中的事务操作 + + - 开启事务环境 + + ```SQL + start transaction + ``` + + - 提交事务 + + ```SQL + commit + ``` + + - 回滚事务 + + ```SQL + rollback + ``` + +4. 查看事务隔离级别 + + ```SQL + show variables like 'transaction_isolation'; + ``` + + ``` + +-----------------------+-----------------+ + | Variable_name | Value | + +-----------------------+-----------------+ + | transaction_isolation | REPEATABLE-READ | + +-----------------------+-----------------+ + ``` + + 可以看出,MySQL 默认的事务隔离级别是`REPEATABLE-READ`。 + +5. 修改(当前会话)事务隔离级别 + + ```SQL + set session transaction isolation level read committed; + ``` + + 重新查看事务隔离级别,结果如下所示。 + + ``` + +-----------------------+----------------+ + | Variable_name | Value | + +-----------------------+----------------+ + | transaction_isolation | READ-COMMITTED | + +-----------------------+----------------+ + ``` + +关系型数据库的事务是一个很大的话题,因为当存在多个并发事务访问数据时,就有可能出现三类读数据的问题(脏读、不可重复读、幻读)和两类更新数据的问题(第一类丢失更新、第二类丢失更新)。想了解这五类问题的,可以阅读我发布在 CSDN 网站上的[《Java面试题全集(上)》](https://blog.csdn.net/jackfrued/article/details/44921941)一文的第80题。为了避免这些问题,关系型数据库底层是有对应的锁机制的,按锁定对象不同可以分为表级锁和行级锁,按并发事务锁定关系可以分为共享锁和独占锁。然而直接使用锁是非常麻烦的,为此数据库为用户提供了自动锁机制,只要用户指定适当的事务隔离级别,数据库就会通过分析 SQL 语句,然后为事务访问的资源加上合适的锁。此外,数据库还会维护这些锁通过各种手段提高系统的性能,这些对用户来说都是透明的。想了解 MySQL 事务和锁的细节知识,推荐大家阅读进阶读物[《高性能MySQL》](https://item.jd.com/11220393.html),这也是数据库方面的经典书籍。 + +ANSI/ISO SQL 92标准定义了4个等级的事务隔离级别,如下表所示。需要说明的是,事务隔离级别和数据访问的并发性是对立的,事务隔离级别越高并发性就越差。所以要根据具体的应用来确定到底使用哪种事务隔离级别,这个地方没有万能的原则。 + + + +### 总结 + +关于 MySQL 的知识肯定远远不止上面列出的这些,比如 MySQL 性能调优、MySQL 运维相关工具、MySQL 数据的备份和恢复、监控 MySQL 服务、部署高可用架构等,这一系列的问题在这里都没有办法逐一展开来讨论,那就留到有需要的时候再进行讲解吧,各位读者也可以自行探索。 diff --git a/Day36-45/43.索引.md b/Day36-45/43.索引.md new file mode 100755 index 0000000..7691a55 --- /dev/null +++ b/Day36-45/43.索引.md @@ -0,0 +1,138 @@ +## 索引 + +索引是关系型数据库中用来提升查询性能最为重要的手段。关系型数据库中的索引就像一本书的目录,我们可以想象一下,如果要从一本书中找出某个知识点,但是这本书没有目录,这将是意见多么可怕的事情!我们估计得一篇一篇的翻下去,才能确定这个知识点到底在什么位置。创建索引虽然会带来存储空间上的开销,就像一本书的目录会占用一部分篇幅一样,但是在牺牲空间后换来的查询时间的减少也是非常显著的。 + +MySQL 数据库中所有数据类型的列都可以被索引。对于MySQL 8.0 版本的 InnoDB 存储引擎来说,它支持三种类型的索引,分别是 B+ 树索引、全文索引和 R 树索引。这里,我们只介绍使用得最为广泛的 B+ 树索引。使用 B+ 树的原因非常简单,因为它是目前在基于磁盘进行海量数据存储和排序上最有效率的数据结构。B+ 树是一棵[平衡树](https://zh.wikipedia.org/zh-cn/%E5%B9%B3%E8%A1%A1%E6%A0%91),树的高度通常为3或4,但是却可以保存从百万级到十亿级的数据,而从这些数据里面查询一条数据,只需要3次或4次 I/O 操作。 + +B+ 树由根节点、中间节点和叶子节点构成,其中叶子节点用来保存排序后的数据。由于记录在索引上是排序过的,因此在一个叶子节点内查找数据时可以使用二分查找,这种查找方式效率非常的高。当数据很少的时候,B+ 树只有一个根节点,数据也就保存在根节点上。随着记录越来越多,B+ 树会发生分裂,根节点不再保存数据,而是提供了访问下一层节点的指针,帮助快速确定数据在哪个叶子节点上。 + +在创建二维表时,我们通常都会为表指定主键列,主键列上默认会创建索引,而对于 MySQL InnoDB 存储引擎来说,因为它使用的是索引组织表这种数据存储结构,所以主键上的索引就是整张表的数据,而这种索引我们也将其称之为**聚集索引**(clustered index)。很显然,一张表只能有一个聚集索引,否则表的数据岂不是要保存多次。我们自己创建的索引都是二级索引(secondary index),更常见的叫法是**非聚集索引**(non-clustered index)。通过我们自定义的非聚集索引只能定位记录的主键,在获取数据时可能需要再通过主键上的聚集索引进行查询,这种现象称为“回表”,因此通过非聚集索引检索数据通常比使用聚集索引检索数据要慢。 + +接下来我们通过一个简单的例子来说明索引的意义,比如我们要根据学生的姓名来查找学生,这个场景在实际开发中应该经常遇到,就跟通过商品名称查找商品是一个道理。我们可以使用 MySQL 的`explain`关键字来查看 SQL 的执行计划(数据库执行 SQL 语句的具体步骤)。 + +```SQL +explain select * from tb_student where stuname='林震南'\G +``` + +``` +*************************** 1. row *************************** + id: 1 + select_type: SIMPLE + table: tb_student + partitions: NULL + type: ALL +possible_keys: NULL + key: NULL + key_len: NULL + ref: NULL + rows: 11 + filtered: 10.00 + Extra: Using where +1 row in set, 1 warning (0.00 sec) +``` + +在上面的 SQL 执行计划中,有几项值得我们关注: + +1. `select_type`:查询的类型。 + - `SIMPLE`:简单 SELECT,不需要使用 UNION 操作或子查询。 + - `PRIMARY`:如果查询包含子查询,最外层的 SELECT 被标记为 PRIMARY。 + - `UNION`:UNION 操作中第二个或后面的 SELECT 语句。 + - `SUBQUERY`:子查询中的第一个 SELECT。 + - `DERIVED`:派生表的 SELECT 子查询。 +2. `table`:查询对应的表。 +3. `type`:MySQL 在表中找到满足条件的行的方式,也称为访问类型,包括:`ALL`(全表扫描)、`index`(索引全扫描,只遍历索引树)、`range`(索引范围扫描)、`ref`(非唯一索引扫描)、`eq_ref`(唯一索引扫描)、`const` / `system`(常量级查询)、`NULL`(不需要访问表或索引)。在所有的访问类型中,很显然 ALL 是性能最差的,它代表的全表扫描是指要扫描表中的每一行才能找到匹配的行。 +4. `possible_keys`:MySQL 可以选择的索引,但是**有可能不会使用**。 +5. `key`:MySQL 真正使用的索引,如果为`NULL`就表示没有使用索引。 +6. `key_len`:使用的索引的长度,在不影响查询的情况下肯定是长度越短越好。 +7. `rows`:执行查询需要扫描的行数,这是一个**预估值**。 +8. `extra`:关于查询额外的信息。 + - `Using filesort`:MySQL 无法利用索引完成排序操作。 + - `Using index`:只使用索引的信息而不需要进一步查表来获取更多的信息。 + - `Using temporary`:MySQL 需要使用临时表来存储结果集,常用于分组和排序。 + - `Impossible where`:`where`子句会导致没有符合条件的行。 + - `Distinct`:MySQL 发现第一个匹配行后,停止为当前的行组合搜索更多的行。 + - `Using where`:查询的列未被索引覆盖,筛选条件并不是索引的前导列。 + +从上面的执行计划可以看出,当我们通过学生名字查询学生时实际上是进行了全表扫描,不言而喻这个查询性能肯定是非常糟糕的,尤其是在表中的行很多的时候。如果我们需要经常通过学生姓名来查询学生,那么就应该在学生姓名对应的列上创建索引,通过索引来加速查询。 + +```SQL +create index idx_student_name on tb_student(stuname); +``` + +再次查看刚才的 SQL 对应的执行计划。 + +```SQL +explain select * from tb_student where stuname='林震南'\G +``` + +``` +*************************** 1. row *************************** + id: 1 + select_type: SIMPLE + table: tb_student + partitions: NULL + type: ref +possible_keys: idx_student_name + key: idx_student_name + key_len: 62 + ref: const + rows: 1 + filtered: 100.00 + Extra: NULL +1 row in set, 1 warning (0.00 sec) +``` + +可以注意到,在对学生姓名创建索引后,刚才的查询已经不是全表扫描而是基于索引的查询,而且扫描的行只有唯一的一行,这显然大大的提升了查询的性能。MySQL 中还允许创建前缀索引,即对索引字段的前N个字符创建索引,这样的话可以减少索引占用的空间(但节省了空间很有可能会浪费时间,**时间和空间是不可调和的矛盾**),如下所示。 + +```SQL +create index idx_student_name_1 on tb_student(stuname(1)); +``` + +上面的索引相当于是根据学生姓名的第一个字来创建的索引,我们再看看 SQL 执行计划。 + +```SQL +explain select * from tb_student where stuname='林震南'\G +``` + +``` +*************************** 1. row *************************** + id: 1 + select_type: SIMPLE + table: tb_student + partitions: NULL + type: ref +possible_keys: idx_student_name + key: idx_student_name + key_len: 5 + ref: const + rows: 2 + filtered: 100.00 + Extra: Using where +1 row in set, 1 warning (0.00 sec) +``` + +不知道大家是否注意到,这一次扫描的行变成了2行,因为学生表中有两个姓“林”的学生,我们只用姓名的第一个字作为索引的话,在查询时通过索引就会找到这两行。 + +如果要删除索引,可以使用下面的SQL。 + +```SQL +alter table tb_student drop index idx_student_name; +``` + +或者 + +```SQL +drop index idx_student_name on tb_student; +``` + +在创建索引时,我们还可以使用复合索引、函数索引(MySQL 5.7 开始支持),用好复合索引实现**索引覆盖**可以减少不必要的排序和回表操作,这样就会让查询的性能成倍的提升,有兴趣的读者可以自行研究。 + +我们简单的为大家总结一下索引的设计原则: + +1. **最适合**索引的列是出现在**WHERE子句**和连接子句中的列。 +2. 索引列的基数越大(取值多、重复值少),索引的效果就越好。 +3. 使用**前缀索引**可以减少索引占用的空间,内存中可以缓存更多的索引。 +4. **索引不是越多越好**,虽然索引加速了读操作(查询),但是写操作(增、删、改)都会变得更慢,因为数据的变化会导致索引的更新,就如同书籍章节的增删需要更新目录一样。 +5. 使用 InnoDB 存储引擎时,表的普通索引都会保存主键的值,所以**主键要尽可能选择较短的数据类型**,这样可以有效的减少索引占用的空间,提升索引的缓存效果。 + +最后,还有一点需要说明,InnoDB 使用的 B-tree 索引,数值类型的列除了等值判断时索引会生效之外,使用`>`、`<`、`>=`、`<=`、`BETWEEN...AND... `、`<>`时,索引仍然生效;对于字符串类型的列,如果使用不以通配符开头的模糊查询,索引也是起作用的,但是其他的情况会导致索引失效,这就意味着很有可能会做全表查询。 diff --git a/Day36-40/39.Python程序接入MySQL数据库.md b/Day36-45/44.Python接入MySQL数据库.md similarity index 84% rename from Day36-40/39.Python程序接入MySQL数据库.md rename to Day36-45/44.Python接入MySQL数据库.md index 727b31d..c8d0079 100755 --- a/Day36-40/39.Python程序接入MySQL数据库.md +++ b/Day36-45/44.Python接入MySQL数据库.md @@ -1,65 +1,7 @@ -## Python程序接入MySQL数据库 +## Python接入MySQL数据库 在 Python3 中,我们可以使用`mysqlclient`或者`pymysql`三方库来接入 MySQL 数据库并实现数据持久化操作。二者的用法完全相同,只是导入的模块名不一样。我们推荐大家使用纯 Python 的三方库`pymysql`,因为它更容易安装成功。下面我们仍然以之前创建的名为`hrs`的数据库为例,为大家演示如何通过 Python 程序操作 MySQL 数据库实现数据持久化操作。 -### 建库建表 - -```SQL --- 创建名为hrs的数据库并指定默认的字符集 -create database `hrs` default character set utf8mb4; - --- 切换到hrs数据库 -use `hrs`; - --- 创建部门表 -create table `tb_dept` -( -`dno` int not null comment '编号', -`dname` varchar(10) not null comment '名称', -`dloc` varchar(20) not null comment '所在地', -primary key (`dno`) -); - --- 插入4个部门 -insert into `tb_dept` values - (10, '会计部', '北京'), - (20, '研发部', '成都'), - (30, '销售部', '重庆'), - (40, '运维部', '深圳'); - --- 创建员工表 -create table `tb_emp` -( -`eno` int not null comment '员工编号', -`ename` varchar(20) not null comment '员工姓名', -`job` varchar(20) not null comment '员工职位', -`mgr` int comment '主管编号', -`sal` int not null comment '员工月薪', -`comm` int comment '每月补贴', -`dno` int not null comment '所在部门编号', -primary key (`eno`), -constraint `fk_emp_mgr` foreign key (`mgr`) references tb_emp (`eno`), -constraint `fk_emp_dno` foreign key (`dno`) references tb_dept (`dno`) -); - --- 插入14个员工 -insert into `tb_emp` values - (7800, '张三丰', '总裁', null, 9000, 1200, 20), - (2056, '乔峰', '分析师', 7800, 5000, 1500, 20), - (3088, '李莫愁', '设计师', 2056, 3500, 800, 20), - (3211, '张无忌', '程序员', 2056, 3200, null, 20), - (3233, '丘处机', '程序员', 2056, 3400, null, 20), - (3251, '张翠山', '程序员', 2056, 4000, null, 20), - (5566, '宋远桥', '会计师', 7800, 4000, 1000, 10), - (5234, '郭靖', '出纳', 5566, 2000, null, 10), - (3344, '黄蓉', '销售主管', 7800, 3000, 800, 30), - (1359, '胡一刀', '销售员', 3344, 1800, 200, 30), - (4466, '苗人凤', '销售员', 3344, 2500, null, 30), - (3244, '欧阳锋', '程序员', 3088, 3200, null, 20), - (3577, '杨过', '会计', 5566, 2200, null, 10), - (3588, '朱九真', '会计', 5566, 2500, null, 10); -``` - ### 接入MySQL 首先,我们可以在命令行或者 PyCharm 的终端中通过下面的命令安装`pymysql`,如果需要接入 MySQL 8,还需要安装一个名为`cryptography`的三方库来支持 MySQL 8 的密码认证方式。 diff --git a/Day36-45/45.大数据平台和HiveSQL.md b/Day36-45/45.大数据平台和HiveSQL.md new file mode 100755 index 0000000..f2572fc --- /dev/null +++ b/Day36-45/45.大数据平台和HiveSQL.md @@ -0,0 +1,270 @@ +## Hive简介 + +[Hive](https://hive.apache.org/) 是 Facebook 开源的一款基于 Hadoop 的数据仓库工具,目前由 Apache 软件基金会维护,它是应用最广泛的大数据处理解决方案,它能将 SQL 查询转变为 MapReduce(Google提出的一个软件架构,用于大规模数据集的并行运算)任务,对 SQL 提供了完美的支持,能够非常方便的实现大数据统计。 + + + + + +> **说明**:可以通过来了解 Hadoop 生态圈。 + +如果要简单的介绍 Hive,那么以下两点是其核心: + +1. 把 HDFS 中结构化的数据映射成表。 +2. 通过把 HQL 进行解析和转换,最终生成一系列基于 Hadoop 的 MapReduce 任务或 Spark 任务,通过执行这些任务完成对数据的处理。也就是说,即便不学习 Java、Scala 这样的编程语言,一样可以实现对数据的处理。 + +Hive的应用场景。 + + + + + +Hive和传统关系型数据库的对比如下图和下表所示。 + + + +| | Hive | RDBMS | +| -------- | ----------------- | ------------ | +| 查询语言 | HQL | SQL | +| 存储数据 | HDFS | 本地文件系统 | +| 执行方式 | MapReduce / Spark | Executor | +| 执行延迟 | 高 | 低 | +| 数据规模 | 大 | 小 | + +### 准备工作 + +1. 搭建如下图所示的大数据平台。 + + + +2. 通过Client节点(跳板机)访问大数据平台。 + + + +3. 创建文件Hadoop的文件系统。 + + ```Shell + hdfs dfs -mkdir /user/root + ``` + +4. 将准备好的数据文件拷贝到Hadoop文件系统中。 + + ```Shell + hdfs dfs -put /home/ubuntu/data/* /user/root + ``` + +5. 进入 hive 命令行。 + + ```Shell + hive + ``` + +### 建库建表 + +1. 创建。 + + ```SQL + create database eshop; + ``` + +2. 删除。 + + ```SQL + drop database eshop cascade; + ``` + +3. 切换。 + + ```SQL + use eshop; + ``` + +#### 数据类型 + +Hive的数据类型如下所示。 + + + +基本数据类型: + +| 数据类型 | 占用空间 | 支持版本 | +| --------- | -------- | -------- | +| tinyint | 1-Byte | | +| smallint | 2-Byte | | +| int | 4-Byte | | +| bigint | 8-Byte | | +| boolean | | | +| float | 4-Byte | | +| double | 8-Byte | | +| string | | | +| binary | | 0.8版本 | +| timestamp | | 0.8版本 | +| decimal | | 0.11版本 | +| char | | 0.13版本 | +| varchar | | 0.12版本 | +| date | | 0.12版本 | + +复合数据类型: + +| 数据类型 | 描述 | 例子 | +| -------- | ------------------------ | --------------------------------------------- | +| struct | 和C语言中的结构体类似 | `struct` | +| map | 由键值对构成的元素的集合 | `map` | +| array | 具有相同类型的变量的容器 | `array` | + +4. 创建内部表。 + + ```SQL + create table if not exists dim_user_info + ( + user_id string, + user_name string, + sex string, + age int, + city string, + firstactivetime string, + level int, + extra1 string, + extra2 map + ) + row format delimited fields terminated by '\t' + collection items terminated by ',' + map keys terminated by ':' + lines terminated by '\n' + stored as textfile; + ``` + +5. 加载数据。 + + ```SQL + load data local inpath '/home/ubuntu/data/user_info/user_info.txt' overwrite into table dim_user_info; + ``` + + 或 + + ```SQL + load data inpath '/user/root/user_info.txt' overwrite into table dim_user_info; + ``` + +6. 创建分区表。 + + ```SQL + create table if not exists fact_user_trade + ( + user_name string, + piece int, + price double, + pay_amount double, + goods_category string, + pay_time bigint + ) + partitioned by (dt string) + row format delimited fields terminated by '\t'; + ``` + +7. 提供分区数据。 + + ```Shell + hdfs dfs -put /home/ubuntu/data/user_trade/* /user/hive/warehouse/eshop.db/fact_user_trade + ``` + +8. 设置动态分区。 + + ```SQL + set hive.exec.dynamic.partition=true; + set hive.exec.dynamic.partition.mode=nonstrict; + set hive.exec.max.dynamic.partitions=10000; + set hive.exec.max.dynamic.partitions.pernode=10000; + ``` + +9. 修复分区。 + + ```SQL + msck repair table fact_user_trade; + ``` + +### 查询 + +#### 基本语法 + +```SQL +-- 查询北京女用户的姓名取前10个 +select user_name from dim_user_info where city='beijing' and sex='female' limit 10; + +-- 查询2019年3月24日购买了food类商品的用户名、购买数量和支付金额(不聚合) +select user_name, piece, pay_amount from fact_user_trade where dt='2019-03-24' and goods_category='food'; + +-- 统计用户 ELLA 在2018年的总支付金额和最近最远两次消费间隔天数 +select sum(pay_amount) as total, datediff(max(from_unixtime(pay_time, 'yyyy-MM-dd')), min(from_unixtime(pay_time, 'yyyy-MM-dd'))) from fact_user_trade where year(dt)='2018' and user_name='ELLA'; +``` + +#### group by + +```SQL +-- 查询2019年1月到4月,每个品类有多少人购买,累计金额是多少 +select goods_category, count(distinct user_name) as total_user, sum(pay_amount) as total_pay from fact_user_trade where dt between '2019-01-01' and '2019-04-30' group by goods_category; +``` + +```SQL +-- 查询2019年4月支付金额超过5万元的用户 +select user_name, sum(pay_amount) as total from fact_user_trade where dt between '2019-04-01' and '2019-04-30' group by user_name having sum(pay_amount) > 50000; +``` + +```hive +-- 查询2018年购买的商品品类在两个以上的用户数 +select count(tmp.user_name) from (select user_name, count(distinct goods_category) as total from fact_user_trade where year(dt)='2018' group by user_name having count(distinct goods_category)>2) tmp; +``` + +#### order by + +```SQL +-- 查询2019年4月支付金额最多的用户前5名 +select user_name, sum(pay_amount) as total from fact_user_trade where dt between '2019-04-01' and '2019-04-30' group by user_name order by total desc limit 5; +``` + +#### 常用函数 + +1. `from_unixtime`:将时间戳转换成日期 + + ```hive + select from_unixtime(pay_time, 'yyyy-MM-dd hh:mm:ss') from fact_user_trade limit 10; + ``` + +2. `unix_timestamp`:将日期转换成时间戳 + +3. `datediff`:计算两个日期的时间差 + + ```Hive + -- 用户首次激活时间与设定参照时间的间隔 + select user_name, datediff('2019-4-1', to_date(firstactivetime)) from dim_user_info limit 10; + ``` + +4. `if`:根据条件返回不同的值 + + ```Hive + -- 统计不同年龄段的用户数 + select case when age < 20 then '20岁以下' when age < 30 then '30岁以下' when age < 40 then '40岁以下' else '40岁以上' end as age_seg, count(distinct user_id) as total from dim_user_info group by case when age < 20 then '20岁以下' when age < 30 then '30岁以下' when age < 40 then '40岁以下' else '40岁以上' end; + ``` + + ```Hive + -- 不同性别高级等用户数量 + select sex, if(level > 5, '高', '低') as level_type, count(distinct user_id) as total from dim_user_info group by sex, if(level > 5, '高', '低'); + ``` + +5. `substr`:字符串取子串 + + ```Hive + -- 统计每个月激活的新用户数 + select substr(firstactivetime, 1, 7) as month, count(distinct user_id) as total from dim_user_info group by substr(firstactivetime, 1, 7); + ``` + +6. `get_json_object`:从JSON字符串中取出指定的`key`对应的`value`,如:`get_json_object(info, '$.first_name')`。 + + ```Hive + -- 统计不同手机品牌的用户数 + select get_json_object(extra1, '$.phonebrand') as phone, count(distinct user_id) as total from user_info group by get_json_object(extra1, '$.phonebrand'); + + select extra2['phonebrand'] as phone, count(distinct user_id) as total from user_info group by extra2['phonebrand']; + ``` + + > 说明:MySQL对应的函数名字叫`json_extract`。 diff --git a/Day36-40/code/HRS_create_and_init.sql b/Day36-45/code/HRS_create_and_init.sql similarity index 100% rename from Day36-40/code/HRS_create_and_init.sql rename to Day36-45/code/HRS_create_and_init.sql diff --git a/Day36-40/code/SRS_create_and_init.sql b/Day36-45/code/SRS_create_and_init.sql similarity index 100% rename from Day36-40/code/SRS_create_and_init.sql rename to Day36-45/code/SRS_create_and_init.sql diff --git a/Day36-40/code/app_store.sql b/Day36-45/code/app_store.sql similarity index 100% rename from Day36-40/code/app_store.sql rename to Day36-45/code/app_store.sql diff --git a/Day36-40/code/contact/main.py b/Day36-45/code/contact/main.py similarity index 100% rename from Day36-40/code/contact/main.py rename to Day36-45/code/contact/main.py diff --git a/Day36-40/code/dist.sql b/Day36-45/code/dist.sql similarity index 100% rename from Day36-40/code/dist.sql rename to Day36-45/code/dist.sql diff --git a/Day36-40/code/hrs_with_answer.sql b/Day36-45/code/hrs_with_answer.sql similarity index 100% rename from Day36-40/code/hrs_with_answer.sql rename to Day36-45/code/hrs_with_answer.sql diff --git a/Day36-40/code/library_create_and_init.sql b/Day36-45/code/library_create_and_init.sql similarity index 100% rename from Day36-40/code/library_create_and_init.sql rename to Day36-45/code/library_create_and_init.sql diff --git a/Day36-40/code/message/内部短消息系统.txt b/Day36-45/code/message/内部短消息系统.txt similarity index 100% rename from Day36-40/code/message/内部短消息系统.txt rename to Day36-45/code/message/内部短消息系统.txt diff --git a/Day36-40/code/mooc_create_and_init.sql b/Day36-45/code/mooc_create_and_init.sql similarity index 100% rename from Day36-40/code/mooc_create_and_init.sql rename to Day36-45/code/mooc_create_and_init.sql diff --git a/Day36-40/code/order.sql b/Day36-45/code/order.sql similarity index 100% rename from Day36-40/code/order.sql rename to Day36-45/code/order.sql diff --git a/Day36-40/code/order_sys.sql b/Day36-45/code/order_sys.sql similarity index 100% rename from Day36-40/code/order_sys.sql rename to Day36-45/code/order_sys.sql diff --git a/Day36-40/code/sharebike_create_and_init.sql b/Day36-45/code/sharebike_create_and_init.sql similarity index 100% rename from Day36-40/code/sharebike_create_and_init.sql rename to Day36-45/code/sharebike_create_and_init.sql diff --git a/Day36-40/code/srs_exercise_origin.sql b/Day36-45/code/srs_exercise_origin.sql similarity index 100% rename from Day36-40/code/srs_exercise_origin.sql rename to Day36-45/code/srs_exercise_origin.sql diff --git a/Day36-40/code/stock.sql b/Day36-45/code/stock.sql similarity index 100% rename from Day36-40/code/stock.sql rename to Day36-45/code/stock.sql diff --git a/Day36-45/res/20210521152457.png b/Day36-45/res/20210521152457.png new file mode 100644 index 0000000..fca3473 Binary files /dev/null and b/Day36-45/res/20210521152457.png differ diff --git a/Day36-45/res/20211105230905.png b/Day36-45/res/20211105230905.png new file mode 100644 index 0000000..d095e02 Binary files /dev/null and b/Day36-45/res/20211105230905.png differ diff --git a/Day36-45/res/20211105231152.jpg b/Day36-45/res/20211105231152.jpg new file mode 100644 index 0000000..dfe379f Binary files /dev/null and b/Day36-45/res/20211105231152.jpg differ diff --git a/Day36-45/res/20211105231255.jpg b/Day36-45/res/20211105231255.jpg new file mode 100644 index 0000000..048a2e2 Binary files /dev/null and b/Day36-45/res/20211105231255.jpg differ diff --git a/Day36-45/res/20211105231620.png b/Day36-45/res/20211105231620.png new file mode 100644 index 0000000..d7f2653 Binary files /dev/null and b/Day36-45/res/20211105231620.png differ diff --git a/Day36-45/res/20211105231719.jpg b/Day36-45/res/20211105231719.jpg new file mode 100644 index 0000000..f7a98fb Binary files /dev/null and b/Day36-45/res/20211105231719.jpg differ diff --git a/Day36-45/res/20211105231815.jpg b/Day36-45/res/20211105231815.jpg new file mode 100644 index 0000000..165a8e9 Binary files /dev/null and b/Day36-45/res/20211105231815.jpg differ diff --git a/Day36-45/res/20211105232024.jpg b/Day36-45/res/20211105232024.jpg new file mode 100644 index 0000000..3c89b5a Binary files /dev/null and b/Day36-45/res/20211105232024.jpg differ diff --git a/Day36-45/res/20211105232109.jpg b/Day36-45/res/20211105232109.jpg new file mode 100644 index 0000000..b605afc Binary files /dev/null and b/Day36-45/res/20211105232109.jpg differ diff --git a/Day36-45/res/20211105232408.jpg b/Day36-45/res/20211105232408.jpg new file mode 100644 index 0000000..907d168 Binary files /dev/null and b/Day36-45/res/20211105232408.jpg differ diff --git a/Day36-45/res/20211105232521.jpg b/Day36-45/res/20211105232521.jpg new file mode 100644 index 0000000..dee265a Binary files /dev/null and b/Day36-45/res/20211105232521.jpg differ diff --git a/Day36-45/res/20211105232608.jpg b/Day36-45/res/20211105232608.jpg new file mode 100644 index 0000000..b1b50e5 Binary files /dev/null and b/Day36-45/res/20211105232608.jpg differ diff --git a/Day36-45/res/20211105232641.jpg b/Day36-45/res/20211105232641.jpg new file mode 100644 index 0000000..5870019 Binary files /dev/null and b/Day36-45/res/20211105232641.jpg differ diff --git a/Day36-45/res/20211105232724.jpg b/Day36-45/res/20211105232724.jpg new file mode 100644 index 0000000..4be9a52 Binary files /dev/null and b/Day36-45/res/20211105232724.jpg differ diff --git a/Day36-45/res/20211105232800.jpg b/Day36-45/res/20211105232800.jpg new file mode 100644 index 0000000..b2699e9 Binary files /dev/null and b/Day36-45/res/20211105232800.jpg differ diff --git a/Day36-45/res/20211105232926.jpg b/Day36-45/res/20211105232926.jpg new file mode 100644 index 0000000..5820a6d Binary files /dev/null and b/Day36-45/res/20211105232926.jpg differ diff --git a/Day36-45/res/20211105233054.jpg b/Day36-45/res/20211105233054.jpg new file mode 100644 index 0000000..4b67fbf Binary files /dev/null and b/Day36-45/res/20211105233054.jpg differ diff --git a/Day36-45/res/20211105233312.jpg b/Day36-45/res/20211105233312.jpg new file mode 100644 index 0000000..a7bff80 Binary files /dev/null and b/Day36-45/res/20211105233312.jpg differ diff --git a/Day36-45/res/20211105233359.jpg b/Day36-45/res/20211105233359.jpg new file mode 100644 index 0000000..e69b003 Binary files /dev/null and b/Day36-45/res/20211105233359.jpg differ diff --git a/Day36-45/res/20211105233643.jpg b/Day36-45/res/20211105233643.jpg new file mode 100644 index 0000000..2d99a29 Binary files /dev/null and b/Day36-45/res/20211105233643.jpg differ diff --git a/Day36-45/res/20211106063939.png b/Day36-45/res/20211106063939.png new file mode 100644 index 0000000..f6788cb Binary files /dev/null and b/Day36-45/res/20211106063939.png differ diff --git a/Day36-45/res/20211121215153.png b/Day36-45/res/20211121215153.png new file mode 100644 index 0000000..5f6c6dd Binary files /dev/null and b/Day36-45/res/20211121215153.png differ diff --git a/Day36-45/res/20211121215901.png b/Day36-45/res/20211121215901.png new file mode 100644 index 0000000..34baf5d Binary files /dev/null and b/Day36-45/res/20211121215901.png differ diff --git a/Day36-45/res/20220210080638.png b/Day36-45/res/20220210080638.png new file mode 100644 index 0000000..57cde2d Binary files /dev/null and b/Day36-45/res/20220210080638.png differ diff --git a/Day36-45/res/20220210080655.png b/Day36-45/res/20220210080655.png new file mode 100644 index 0000000..21e8d49 Binary files /dev/null and b/Day36-45/res/20220210080655.png differ diff --git a/Day36-45/res/HADOOP-ECOSYSTEM-Edureka.png b/Day36-45/res/HADOOP-ECOSYSTEM-Edureka.png new file mode 100755 index 0000000..ee1dcb7 Binary files /dev/null and b/Day36-45/res/HADOOP-ECOSYSTEM-Edureka.png differ diff --git a/Day36-45/res/QQ20220707-211310@2x.png b/Day36-45/res/QQ20220707-211310@2x.png new file mode 100755 index 0000000..fa4cdb9 Binary files /dev/null and b/Day36-45/res/QQ20220707-211310@2x.png differ diff --git a/Day36-45/res/QQ20220707-211408@2x.png b/Day36-45/res/QQ20220707-211408@2x.png new file mode 100755 index 0000000..d29f54f Binary files /dev/null and b/Day36-45/res/QQ20220707-211408@2x.png differ diff --git a/Day36-40/res/conceptual_model.png b/Day36-45/res/conceptual_model.png similarity index 100% rename from Day36-40/res/conceptual_model.png rename to Day36-45/res/conceptual_model.png diff --git a/Day36-40/res/er_diagram.png b/Day36-45/res/er_diagram.png similarity index 100% rename from Day36-40/res/er_diagram.png rename to Day36-45/res/er_diagram.png diff --git a/Day36-45/res/hive_clients_and_services.png b/Day36-45/res/hive_clients_and_services.png new file mode 100644 index 0000000..8dd5b26 Binary files /dev/null and b/Day36-45/res/hive_clients_and_services.png differ diff --git a/Day36-45/res/hive_data_types.png b/Day36-45/res/hive_data_types.png new file mode 100755 index 0000000..a843f75 Binary files /dev/null and b/Day36-45/res/hive_data_types.png differ diff --git a/Day36-45/res/hive_vs_rdbms.png b/Day36-45/res/hive_vs_rdbms.png new file mode 100755 index 0000000..e83d279 Binary files /dev/null and b/Day36-45/res/hive_vs_rdbms.png differ diff --git a/Day36-45/res/sql_to_mr.png b/Day36-45/res/sql_to_mr.png new file mode 100755 index 0000000..102b79b Binary files /dev/null and b/Day36-45/res/sql_to_mr.png differ diff --git a/Day36-45/res/what_hive_can_do.png b/Day36-45/res/what_hive_can_do.png new file mode 100755 index 0000000..1920f38 Binary files /dev/null and b/Day36-45/res/what_hive_can_do.png differ diff --git a/Day36-45/res/what_hive_can_not_do.png b/Day36-45/res/what_hive_can_not_do.png new file mode 100755 index 0000000..53da135 Binary files /dev/null and b/Day36-45/res/what_hive_can_not_do.png differ diff --git a/Day41-55/41.Django快速上手.md b/Day46-60/46.Django快速上手.md similarity index 100% rename from Day41-55/41.Django快速上手.md rename to Day46-60/46.Django快速上手.md diff --git a/Day41-55/42.深入模型.md b/Day46-60/47.深入模型.md similarity index 100% rename from Day41-55/42.深入模型.md rename to Day46-60/47.深入模型.md diff --git a/Day41-55/43.静态资源和Ajax请求.md b/Day46-60/48.静态资源和Ajax请求.md similarity index 100% rename from Day41-55/43.静态资源和Ajax请求.md rename to Day46-60/48.静态资源和Ajax请求.md diff --git a/Day41-55/44.Cookie和Session.md b/Day46-60/49.Cookie和Session.md similarity index 100% rename from Day41-55/44.Cookie和Session.md rename to Day46-60/49.Cookie和Session.md diff --git a/Day41-55/45.制作报表.md b/Day46-60/50.制作报表.md similarity index 100% rename from Day41-55/45.制作报表.md rename to Day46-60/50.制作报表.md diff --git a/Day41-55/46.日志和调试工具栏.md b/Day46-60/51.日志和调试工具栏.md similarity index 100% rename from Day41-55/46.日志和调试工具栏.md rename to Day46-60/51.日志和调试工具栏.md diff --git a/Day41-55/47.中间件的应用.md b/Day46-60/52.中间件的应用.md similarity index 100% rename from Day41-55/47.中间件的应用.md rename to Day46-60/52.中间件的应用.md diff --git a/Day41-55/48.前后端分离开发入门.md b/Day46-60/53.前后端分离开发入门.md similarity index 100% rename from Day41-55/48.前后端分离开发入门.md rename to Day46-60/53.前后端分离开发入门.md diff --git a/Day41-55/49.RESTful架构和DRF入门.md b/Day46-60/54.RESTful架构和DRF入门.md similarity index 100% rename from Day41-55/49.RESTful架构和DRF入门.md rename to Day46-60/54.RESTful架构和DRF入门.md diff --git a/Day41-55/50.RESTful架构和DRF进阶.md b/Day46-60/55.RESTful架构和DRF进阶.md similarity index 100% rename from Day41-55/50.RESTful架构和DRF进阶.md rename to Day46-60/55.RESTful架构和DRF进阶.md diff --git a/Day41-55/51.使用缓存.md b/Day46-60/56.使用缓存.md similarity index 100% rename from Day41-55/51.使用缓存.md rename to Day46-60/56.使用缓存.md diff --git a/Day41-55/52.接入三方平台.md b/Day46-60/57.接入三方平台.md similarity index 100% rename from Day41-55/52.接入三方平台.md rename to Day46-60/57.接入三方平台.md diff --git a/Day41-55/53.异步任务和定时任务.md b/Day46-60/58.异步任务和定时任务.md similarity index 80% rename from Day41-55/53.异步任务和定时任务.md rename to Day46-60/58.异步任务和定时任务.md index 61e320b..6e72fbc 100755 --- a/Day41-55/53.异步任务和定时任务.md +++ b/Day46-60/58.异步任务和定时任务.md @@ -4,11 +4,5 @@ 上一章节中讲到的发短信和上传文件到云存储为例,这两个操作前者属于时间不确定的操作(因为作为调用者,我们不能确定三方平台响应的时间),后者属于耗时间的操作(如果文件较大或者三方平台不稳定,都可能导致上传的时间较长),很显然,这两个操作都可以做异步化处理。 -在Python项目中实现异步化处理可以使用多线程或借助三方库Celery来完成。 - -### 使用Celery实现异步化 - - - -### 使用多线程实现异步化 +在 Python 项目中,我们可以使用三方库Celery来完成异步任务和定时任务,关于Celery的内容,请移步到[《使用Django开发商业项目》](../Day91-100/95.使用Django开发商业项目.md)一文。 diff --git a/Day41-55/54.单元测试.md b/Day46-60/59.单元测试.md similarity index 100% rename from Day41-55/54.单元测试.md rename to Day46-60/59.单元测试.md diff --git a/Day41-55/55.项目上线.md b/Day46-60/60.项目上线.md similarity index 100% rename from Day41-55/55.项目上线.md rename to Day46-60/60.项目上线.md diff --git a/Day41-55/code/hellodjango/first/__init__.py b/Day46-60/code/hellodjango/first/__init__.py similarity index 100% rename from Day41-55/code/hellodjango/first/__init__.py rename to Day46-60/code/hellodjango/first/__init__.py diff --git a/Day41-55/code/hellodjango/first/admin.py b/Day46-60/code/hellodjango/first/admin.py similarity index 100% rename from Day41-55/code/hellodjango/first/admin.py rename to Day46-60/code/hellodjango/first/admin.py diff --git a/Day41-55/code/hellodjango/first/apps.py b/Day46-60/code/hellodjango/first/apps.py similarity index 100% rename from Day41-55/code/hellodjango/first/apps.py rename to Day46-60/code/hellodjango/first/apps.py diff --git a/Day41-55/code/hellodjango/first/migrations/__init__.py b/Day46-60/code/hellodjango/first/migrations/__init__.py similarity index 100% rename from Day41-55/code/hellodjango/first/migrations/__init__.py rename to Day46-60/code/hellodjango/first/migrations/__init__.py diff --git a/Day41-55/code/hellodjango/first/models.py b/Day46-60/code/hellodjango/first/models.py similarity index 100% rename from Day41-55/code/hellodjango/first/models.py rename to Day46-60/code/hellodjango/first/models.py diff --git a/Day41-55/code/hellodjango/first/tests.py b/Day46-60/code/hellodjango/first/tests.py similarity index 100% rename from Day41-55/code/hellodjango/first/tests.py rename to Day46-60/code/hellodjango/first/tests.py diff --git a/Day41-55/code/hellodjango/first/views.py b/Day46-60/code/hellodjango/first/views.py similarity index 100% rename from Day41-55/code/hellodjango/first/views.py rename to Day46-60/code/hellodjango/first/views.py diff --git a/Day41-55/code/hellodjango/hellodjango/__init__.py b/Day46-60/code/hellodjango/hellodjango/__init__.py similarity index 100% rename from Day41-55/code/hellodjango/hellodjango/__init__.py rename to Day46-60/code/hellodjango/hellodjango/__init__.py diff --git a/Day41-55/code/hellodjango/hellodjango/settings.py b/Day46-60/code/hellodjango/hellodjango/settings.py similarity index 100% rename from Day41-55/code/hellodjango/hellodjango/settings.py rename to Day46-60/code/hellodjango/hellodjango/settings.py diff --git a/Day41-55/code/hellodjango/hellodjango/urls.py b/Day46-60/code/hellodjango/hellodjango/urls.py similarity index 100% rename from Day41-55/code/hellodjango/hellodjango/urls.py rename to Day46-60/code/hellodjango/hellodjango/urls.py diff --git a/Day41-55/code/hellodjango/hellodjango/wsgi.py b/Day46-60/code/hellodjango/hellodjango/wsgi.py similarity index 100% rename from Day41-55/code/hellodjango/hellodjango/wsgi.py rename to Day46-60/code/hellodjango/hellodjango/wsgi.py diff --git a/Day41-55/code/hellodjango/manage.py b/Day46-60/code/hellodjango/manage.py similarity index 100% rename from Day41-55/code/hellodjango/manage.py rename to Day46-60/code/hellodjango/manage.py diff --git a/Day41-55/code/hellodjango/templates/index.html b/Day46-60/code/hellodjango/templates/index.html similarity index 100% rename from Day41-55/code/hellodjango/templates/index.html rename to Day46-60/code/hellodjango/templates/index.html diff --git a/Day41-55/res/CSRF.png b/Day46-60/res/CSRF.png similarity index 100% rename from Day41-55/res/CSRF.png rename to Day46-60/res/CSRF.png diff --git a/Day41-55/res/Django-Flowchart.png b/Day46-60/res/Django-Flowchart.png similarity index 100% rename from Day41-55/res/Django-Flowchart.png rename to Day46-60/res/Django-Flowchart.png diff --git a/Day41-55/res/Django-MTV.png b/Day46-60/res/Django-MTV.png similarity index 100% rename from Day41-55/res/Django-MTV.png rename to Day46-60/res/Django-MTV.png diff --git a/Day41-55/res/asynchronous-web-request.png b/Day46-60/res/asynchronous-web-request.png similarity index 100% rename from Day41-55/res/asynchronous-web-request.png rename to Day46-60/res/asynchronous-web-request.png diff --git a/Day41-55/res/captcha.png b/Day46-60/res/captcha.png similarity index 100% rename from Day41-55/res/captcha.png rename to Day46-60/res/captcha.png diff --git a/Day41-55/res/cookie_xstorage_indexeddb.png b/Day46-60/res/cookie_xstorage_indexeddb.png similarity index 100% rename from Day41-55/res/cookie_xstorage_indexeddb.png rename to Day46-60/res/cookie_xstorage_indexeddb.png diff --git a/Day41-55/res/csrf-simple.png b/Day46-60/res/csrf-simple.png similarity index 100% rename from Day41-55/res/csrf-simple.png rename to Day46-60/res/csrf-simple.png diff --git a/Day41-55/res/debug-toolbar.png b/Day46-60/res/debug-toolbar.png similarity index 100% rename from Day41-55/res/debug-toolbar.png rename to Day46-60/res/debug-toolbar.png diff --git a/Day41-55/res/django-admin-add-model.png b/Day46-60/res/django-admin-add-model.png similarity index 100% rename from Day41-55/res/django-admin-add-model.png rename to Day46-60/res/django-admin-add-model.png diff --git a/Day41-55/res/django-admin-apps.png b/Day46-60/res/django-admin-apps.png similarity index 100% rename from Day41-55/res/django-admin-apps.png rename to Day46-60/res/django-admin-apps.png diff --git a/Day41-55/res/django-admin-delete-update-model.png b/Day46-60/res/django-admin-delete-update-model.png similarity index 100% rename from Day41-55/res/django-admin-delete-update-model.png rename to Day46-60/res/django-admin-delete-update-model.png diff --git a/Day41-55/res/django-admin-login.png b/Day46-60/res/django-admin-login.png similarity index 100% rename from Day41-55/res/django-admin-login.png rename to Day46-60/res/django-admin-login.png diff --git a/Day41-55/res/django-admin-models.png b/Day46-60/res/django-admin-models.png similarity index 100% rename from Day41-55/res/django-admin-models.png rename to Day46-60/res/django-admin-models.png diff --git a/Day41-55/res/django-admin-view-models-subject.png b/Day46-60/res/django-admin-view-models-subject.png similarity index 100% rename from Day41-55/res/django-admin-view-models-subject.png rename to Day46-60/res/django-admin-view-models-subject.png diff --git a/Day41-55/res/django-admin-view-models-teacher.png b/Day46-60/res/django-admin-view-models-teacher.png similarity index 100% rename from Day41-55/res/django-admin-view-models-teacher.png rename to Day46-60/res/django-admin-view-models-teacher.png diff --git a/Day41-55/res/django-admin-view-models.png b/Day46-60/res/django-admin-view-models.png similarity index 100% rename from Day41-55/res/django-admin-view-models.png rename to Day46-60/res/django-admin-view-models.png diff --git a/Day41-55/res/django-index-1.png b/Day46-60/res/django-index-1.png similarity index 100% rename from Day41-55/res/django-index-1.png rename to Day46-60/res/django-index-1.png diff --git a/Day41-55/res/django-index-2.png b/Day46-60/res/django-index-2.png similarity index 100% rename from Day41-55/res/django-index-2.png rename to Day46-60/res/django-index-2.png diff --git a/Day41-55/res/django-middleware.png b/Day46-60/res/django-middleware.png similarity index 100% rename from Day41-55/res/django-middleware.png rename to Day46-60/res/django-middleware.png diff --git a/Day41-55/res/drf-app.png b/Day46-60/res/drf-app.png similarity index 100% rename from Day41-55/res/drf-app.png rename to Day46-60/res/drf-app.png diff --git a/Day41-55/res/echarts_bar_graph.png b/Day46-60/res/echarts_bar_graph.png similarity index 100% rename from Day41-55/res/echarts_bar_graph.png rename to Day46-60/res/echarts_bar_graph.png diff --git a/Day41-55/res/http-request.png b/Day46-60/res/http-request.png similarity index 100% rename from Day41-55/res/http-request.png rename to Day46-60/res/http-request.png diff --git a/Day41-55/res/http-response.png b/Day46-60/res/http-response.png similarity index 100% rename from Day41-55/res/http-response.png rename to Day46-60/res/http-response.png diff --git a/Day41-55/res/json-web-token.png b/Day46-60/res/json-web-token.png similarity index 100% rename from Day41-55/res/json-web-token.png rename to Day46-60/res/json-web-token.png diff --git a/Day41-55/res/luosimao-pay-onlinebuy.png b/Day46-60/res/luosimao-pay-onlinebuy.png similarity index 100% rename from Day41-55/res/luosimao-pay-onlinebuy.png rename to Day46-60/res/luosimao-pay-onlinebuy.png diff --git a/Day41-55/res/luosimao-sms-apikey.png b/Day46-60/res/luosimao-sms-apikey.png similarity index 100% rename from Day41-55/res/luosimao-sms-apikey.png rename to Day46-60/res/luosimao-sms-apikey.png diff --git a/Day41-55/res/luosimao-sms-signature.png b/Day46-60/res/luosimao-sms-signature.png similarity index 100% rename from Day41-55/res/luosimao-sms-signature.png rename to Day46-60/res/luosimao-sms-signature.png diff --git a/Day41-55/res/luosimao-sms-whitelist.png b/Day46-60/res/luosimao-sms-whitelist.png similarity index 100% rename from Day41-55/res/luosimao-sms-whitelist.png rename to Day46-60/res/luosimao-sms-whitelist.png diff --git a/Day41-55/res/mvc.png b/Day46-60/res/mvc.png similarity index 100% rename from Day41-55/res/mvc.png rename to Day46-60/res/mvc.png diff --git a/Day41-55/res/pycharm-django-project.png b/Day46-60/res/pycharm-django-project.png similarity index 100% rename from Day41-55/res/pycharm-django-project.png rename to Day46-60/res/pycharm-django-project.png diff --git a/Day41-55/res/pycharm-django-server.png b/Day46-60/res/pycharm-django-server.png similarity index 100% rename from Day41-55/res/pycharm-django-server.png rename to Day46-60/res/pycharm-django-server.png diff --git a/Day41-55/res/pycharm-django-static.png b/Day46-60/res/pycharm-django-static.png similarity index 100% rename from Day41-55/res/pycharm-django-static.png rename to Day46-60/res/pycharm-django-static.png diff --git a/Day41-55/res/pycharm-django-template.png b/Day46-60/res/pycharm-django-template.png similarity index 100% rename from Day41-55/res/pycharm-django-template.png rename to Day46-60/res/pycharm-django-template.png diff --git a/Day41-55/res/pycharm-django-virtual-environment.png b/Day46-60/res/pycharm-django-virtual-environment.png similarity index 100% rename from Day41-55/res/pycharm-django-virtual-environment.png rename to Day46-60/res/pycharm-django-virtual-environment.png diff --git a/Day41-55/res/pycharm-install-django.png b/Day46-60/res/pycharm-install-django.png similarity index 100% rename from Day41-55/res/pycharm-install-django.png rename to Day46-60/res/pycharm-install-django.png diff --git a/Day41-55/res/pycharm-python-manage.png b/Day46-60/res/pycharm-python-manage.png similarity index 100% rename from Day41-55/res/pycharm-python-manage.png rename to Day46-60/res/pycharm-python-manage.png diff --git a/Day41-55/res/pycharm-vote-project.png b/Day46-60/res/pycharm-vote-project.png similarity index 100% rename from Day41-55/res/pycharm-vote-project.png rename to Day46-60/res/pycharm-vote-project.png diff --git a/Day41-55/res/qiniu-document-python.png b/Day46-60/res/qiniu-document-python.png similarity index 100% rename from Day41-55/res/qiniu-document-python.png rename to Day46-60/res/qiniu-document-python.png diff --git a/Day41-55/res/qiniu-file-management.png b/Day46-60/res/qiniu-file-management.png similarity index 100% rename from Day41-55/res/qiniu-file-management.png rename to Day46-60/res/qiniu-file-management.png diff --git a/Day41-55/res/qiniu-manage-console.png b/Day46-60/res/qiniu-manage-console.png similarity index 100% rename from Day41-55/res/qiniu-manage-console.png rename to Day46-60/res/qiniu-manage-console.png diff --git a/Day41-55/res/qiniu-secretkey-management.png b/Day46-60/res/qiniu-secretkey-management.png similarity index 100% rename from Day41-55/res/qiniu-secretkey-management.png rename to Day46-60/res/qiniu-secretkey-management.png diff --git a/Day41-55/res/qiniu-storage-create.png b/Day46-60/res/qiniu-storage-create.png similarity index 100% rename from Day41-55/res/qiniu-storage-create.png rename to Day46-60/res/qiniu-storage-create.png diff --git a/Day41-55/res/qiniu-storage-service.png b/Day46-60/res/qiniu-storage-service.png similarity index 100% rename from Day41-55/res/qiniu-storage-service.png rename to Day46-60/res/qiniu-storage-service.png diff --git a/Day41-55/res/redis-cache-service.png b/Day46-60/res/redis-cache-service.png similarity index 100% rename from Day41-55/res/redis-cache-service.png rename to Day46-60/res/redis-cache-service.png diff --git a/Day41-55/res/sessionid_from_cookie.png b/Day46-60/res/sessionid_from_cookie.png similarity index 100% rename from Day41-55/res/sessionid_from_cookie.png rename to Day46-60/res/sessionid_from_cookie.png diff --git a/Day41-55/res/synchronous-web-request.png b/Day46-60/res/synchronous-web-request.png similarity index 100% rename from Day41-55/res/synchronous-web-request.png rename to Day46-60/res/synchronous-web-request.png diff --git a/Day41-55/res/web-application.png b/Day46-60/res/web-application.png similarity index 100% rename from Day41-55/res/web-application.png rename to Day46-60/res/web-application.png diff --git a/Day56-60/56-60.用FastAPI开发数据接口.md b/Day56-60/56-60.用FastAPI开发数据接口.md deleted file mode 100755 index 16eb876..0000000 --- a/Day56-60/56-60.用FastAPI开发数据接口.md +++ /dev/null @@ -1,70 +0,0 @@ -## 用FastAPI开发网络数据接口 - -FastAPI 是一个用于构建API(网络数据接口)的现代、高性能的Web框架,基于Python 3.6+,使用了Python中的类型提示进行类型检查,非常符合工程化开发的需求,在业界有非常好的口碑。下面,我们先用代码告诉大家FastAPI到底能做什么,然后再来讲解它的方方面面。 - -### FastAPI五分钟上手 - -1. 安装依赖库和ASGI服务器(支持异步I/O的Python服务器)。 - - ```Bash - pip install fastapi - pip install uvicorn - ``` - -2. 编写代码`main.py`。 - - ```Python - from fastapi import FastAPI - - app = FastAPI() - - - @app.get('/') - def say_hello(): - return {'code': 200, 'message': 'hello, world!'} - ``` - -3. 运行服务。 - - ```Bash - uvicorn main:app --reload - ``` - - > **说明**:上面运行uvicorn时使用的`--reload`参数会在代码发生变更时自动重新加载新的内容,这个参数在开发阶段非常的有用。 - -4. 访问服务。 - - ![](res/run-first-demo.png) - -5. 查看文档。 - - ![](res/first-demo-docs.png) - - > **注意**:FastAPI会基于[Swagger UI](https://swagger.io/tools/swagger-ui/)自动为数据接口生成对应的文档。 - -### 请求和响应 - - - -### 接入关系型数据库 - -我们可以使用SQLAlchemy三方库来实现对关系型数据库的接入。SQLAlchemy是一个ORM(对象关系映射)框架,ORM框架可以解决Python程序的面向对象模型和关系型数据库的关系模型并不匹配的问题,使得我们可以用面向对象的方式实现数据的CRUD操作。 - -### 依赖注入 - - - -### 中间件 - - - -### 异步化 - - - -### 虚拟化部署(Docker) - - - -### 项目实战:车辆违章查询 - diff --git a/Day56-60/res/QQ20201127-180608@2x.png b/Day56-60/res/QQ20201127-180608@2x.png deleted file mode 100755 index 59916eb..0000000 Binary files a/Day56-60/res/QQ20201127-180608@2x.png and /dev/null differ diff --git a/Day56-60/res/QQ20201127-180630@2x.png b/Day56-60/res/QQ20201127-180630@2x.png deleted file mode 100755 index d7ac33e..0000000 Binary files a/Day56-60/res/QQ20201127-180630@2x.png and /dev/null differ diff --git a/Day56-60/res/QQ20201127-180711@2x.png b/Day56-60/res/QQ20201127-180711@2x.png deleted file mode 100755 index cc8bdf7..0000000 Binary files a/Day56-60/res/QQ20201127-180711@2x.png and /dev/null differ diff --git a/Day56-60/res/QQ20201127-180820@2x.png b/Day56-60/res/QQ20201127-180820@2x.png deleted file mode 100755 index dd8a18e..0000000 Binary files a/Day56-60/res/QQ20201127-180820@2x.png and /dev/null differ diff --git a/Day56-60/res/QQ20201127-180844@2x.png b/Day56-60/res/QQ20201127-180844@2x.png deleted file mode 100755 index 72577fb..0000000 Binary files a/Day56-60/res/QQ20201127-180844@2x.png and /dev/null differ diff --git a/Day56-60/res/first-demo-docs.png b/Day56-60/res/first-demo-docs.png deleted file mode 100755 index d4688f0..0000000 Binary files a/Day56-60/res/first-demo-docs.png and /dev/null differ diff --git a/Day56-60/res/run-first-demo.png b/Day56-60/res/run-first-demo.png deleted file mode 100755 index a07b985..0000000 Binary files a/Day56-60/res/run-first-demo.png and /dev/null differ diff --git a/Day66-80/67.环境准备.md b/Day66-80/67.环境准备.md index d839b84..2b89671 100755 --- a/Day66-80/67.环境准备.md +++ b/Day66-80/67.环境准备.md @@ -156,4 +156,3 @@ JupyterLab 是基于网页的用于交互计算的应用程序,可以用于代 | `Up` / `Down` | 光标上移/下移一行或移到上/下一个单元格 | > **说明**:对于 macOS 系统可以将`Alt`键替换成`Option`键,将`Ctrl`键替换成`Command`键。 - diff --git a/Day66-80/78.数据可视化-1.md b/Day66-80/78.数据可视化-1.md index 1a09c0b..d259545 100755 --- a/Day66-80/78.数据可视化-1.md +++ b/Day66-80/78.数据可视化-1.md @@ -47,7 +47,7 @@ plt.figure(figsize=(8, 4), dpi=120, facecolor='darkgray') plt.subplot(2, 2, 1) ``` -### 绘制图像 +### 绘制图表 #### 折线图 @@ -341,7 +341,7 @@ plt.show() > **说明**:由于数据是随机生成的,大家运行上面的代码生成的图表可能跟我这里并不相同,以实际运行结果为准。 -### 显示或保存图像 +### 显示和保存图表 可以使用`pyplot`模块的`show`函数来显示绘制的图表,我们在上面的代码中使用过这个函数。如果希望保存图表,可以使用`savefig`函数。需要注意的是,如果要同时显示和保存图表,应该先执行`savefig`函数,再执行`show`函数,因为在调用`show`函数时,图表已经被释放,位于`show`函数之后的`savefig`保存的只是一个空白的区域。 diff --git a/Day66-80/79.数据可视化-2.md b/Day66-80/79.数据可视化-2.md index 9e18414..fcea9d3 100644 --- a/Day66-80/79.数据可视化-2.md +++ b/Day66-80/79.数据可视化-2.md @@ -117,7 +117,7 @@ plt.show() -### 3D图 +### 3D图表 matplotlib 还可以用于绘制3D图,具体的内容大家可以参考官方文档,下面我们用一段简单的代码为大家展示如何绘制3D图表。 diff --git a/README.md b/README.md index af1c64b..dd19a37 100755 --- a/README.md +++ b/README.md @@ -2,17 +2,17 @@ > **作者**:骆昊 > -> **说明**:从项目上线到获得8w+星标以来,一直收到反馈说基础部分(前15天的内容)对新手来说是比较困难的,建议有配套视频进行讲解。最近把基础部分的内容重新制作了一个名为[“Python-Core-50-Courses”]()的项目,**用更为简单通俗的方式重写了这部分内容并附带了视频讲解**,初学者可以关注下这个新项目。国内用户如果访问GitHub比较慢的话,可以关注我的**知乎号[Python-Jack](https://www.zhihu.com/people/jackfrued)**,上面的[“从零开始学Python”]()专栏比较适合初学者,其他的专栏也在持续创作和更新中,欢迎大家关注并点赞评论。 +> **说明**:从项目上线到获得8w+星标以来,一直收到反馈说基础部分(前15天的内容)对新手来说是比较困难的,建议有配套视频进行讲解。最近把基础部分的内容重新制作了一个名为[“Python-Core-50-Courses”]()的项目,用更为简单通俗的方式重写了这部分内容并附带了视频讲解,初学者可以看看这个新的仓库。国内用户如果访问GitHub比较慢的话,可以关注我的**知乎号[Python-Jack](https://www.zhihu.com/people/jackfrued)**,上面的[“从零开始学Python”]()专栏比较适合初学者,其他的专栏如“数据思维和统计思维”、“基于Python的数据分析”等也在持续创作和更新中,欢迎大家关注、点赞和评论。 > -> 需要加入QQ学习群的可以扫描下面的二维码,三个群加一个即可,不要重复进群。学习群会为大家提供**学习资源**和**问题解答**,如果有**Python体验课**和**行业公开课**会提前在群里通知大家,欢迎大家加入。 +> 大家在学习过程中如果遇到一些棘手的问题或者需要相关的学习资源,可以加入下面的QQ交流群,三个群是一样的,加入一个即可,请不要重复加群,也不要在群里发布广告和其他色情、低俗或敏感内容。**如果缺乏自律性,有付费学习的需求,可以私聊我,添加我的企业微信,我会给大家提供一些学习方案和职业规划方面的指导**。 > -> +> > > 配套的视频在抖音和B站持续更新中,有兴趣的小伙伴可以关注我的抖音或B站账号,最近刚刚起号,还希望大家多多支持,非常感谢您! > -> - - +> +> +> 大家一直催更的《机器学习和深度学习》因个人和公司的原因,一直处于停滞状态,近期会开始更新相关内容,感谢大家一如既往的支持和理解。 ### Python应用领域和职业发展分析 @@ -53,7 +53,7 @@ Python在以下领域都有用武之地。 - Don't be one of the leeches. (不要当伸手党) - Either outstanding or out. (要么出众,要么出局) -### Day01~15 - [Python语言基础](./Day01-15) +### Day01~15 - Python语言基础 #### Day01 - [初识Python](./Day01-15/01.初识Python.md) @@ -201,36 +201,107 @@ Python在以下领域都有用武之地。 - 网络访问和管理 - 其他相关内容 -### Day36~40 - [数据库基础和进阶](./Day36-40) +### Day36~45 - 数据库基础和进阶 + +#### Day36 - [关系型数据库和MySQL概述](./Day36-45/36.关系型数据库和MySQL概述.md) - 关系型数据库概述 -- MySQL的安装和使用 -- SQL的使用 -- DDL - 数据定义语言 - `create` / `drop` / `alter` -- DML - 数据操作语言 - `insert` / `delete` / `update` -- DQL - 数据查询语言 - `select` -- DCL - 数据控制语言 - `grant` / `revoke` -- MySQL新特性 -- 窗口函数的应用 -- JSON数据类型 -- 相关知识 -- 数据完整性和一致性 -- 视图、函数、过程、触发器 -- 事务和锁 -- 执行计划和索引 -- 范式理论和反范式设计 -- 在Python中操作MySQL +- MySQL简介 +- 安装MySQL +- MySQL基本命令 -### Day41~55 - [实战Django](./Day41-55) +#### Day37 - [SQL详解之DDL](./Day36-45/37.SQL详解之DDL.md) -#### Day41 - [Django快速上手](./Day41-55/41.Django快速上手.md) +- 建库建表 +- 删除表和修改表 + +#### Day38 - [SQL详解之DML](./Day36-45/38.SQL详解之DML.md) + +- insert操作 +- delete操作 +- update操作 + +#### Day39 - [SQL详解之DQL](./Day36-45/39.SQL详解之DQL.md) + +- 投影和别名 +- 筛选数据 +- 空值处理 +- 去重 +- 排序 +- 聚合函数 +- 嵌套查询 +- 分组 +- 表连接 + - +- 窗口函数 + +#### Day40 - [SQL详解之DCL](./Day36-45/40.SQL详解之DCL.md) + +- 创建用户 +- 授予权限 +- 召回权限 + +#### Day41 - [MySQL新特性](./Day36-45/41.MySQL新特性.md) + +- JSON类型 +- 窗口函数 +- 公共表表达式 + +#### Day42 - [视图、函数和过程](./Day36-45/42.视图、函数和过程.md) + +- 视图 + - 使用场景 + - 创建视图 + - 使用限制 +- 函数 + - 内置函数 + - 用户自定义函数(UDF) +- 过程 + - 创建过程 + - 调用过程 + +#### Day43 - [索引](./Day36-45/43.索引.md) + +- 执行计划 +- 索引的原理 +- 创建索引 + - 普通索引 + - 唯一索引 + - 前缀索引 + - 复合索引 +- 注意事项 + +#### Day44 - [Python接入MySQL数据库](./Day36-45/44.Python接入MySQL数据库.md) + +- 安装三方库 +- 创建连接 +- 获取游标 +- 执行SQL语句 +- 通过游标抓取数据 +- 事务提交和回滚 +- 释放连接 +- 编写ETL脚本 + +#### Day45 - [大数据平台和HiveSQL](./Day36-45/45.大数据平台和HiveSQL.md) + +- Hadoop生态圈 +- Hive概述 +- 准备工作 +- 数据类型 +- DDL操作 +- DML操作 +- 数据查询 + +### Day46~60 - 实战Django + +#### Day46 - [Django快速上手](./Day46-60/46.Django快速上手.md) - Web应用工作机制 - HTTP请求和响应 - Django框架概述 - 5分钟快速上手 -#### Day42 - [深入模型](./Day41-55/42.深入模型.md) +#### Day47 - [深入模型](./Day46-60/47.深入模型.md) - 关系型数据库配置 - 使用ORM完成对模型的CRUD操作 @@ -238,20 +309,20 @@ Python在以下领域都有用武之地。 - Django模型最佳实践 - 模型定义参考 -#### Day43 - [静态资源和Ajax请求](./Day41-55/43.静态资源和Ajax请求.md) +#### Day48 - [静态资源和Ajax请求](./Day46-60/48.静态资源和Ajax请求.md) - 加载静态资源 - Ajax概述 - 用Ajax实现投票功能 -#### Day44 - [Cookie和Session](./Day41-55/44.Cookie和Session.md) +#### Day49 - [Cookie和Session](./Day46-60/49.Cookie和Session.md) - 实现用户跟踪 - cookie和session的关系 - Django框架对session的支持 - 视图函数中的cookie读写操作 -#### Day45 - [报表和日志](./Day41-55/45.制作报表.md) +#### Day50 - [报表和日志](./Day46-60/50.制作报表.md) - 通过`HttpResponse`修改响应头 - 使用`StreamingHttpResponse`处理大文件 @@ -259,28 +330,37 @@ Python在以下领域都有用武之地。 - 使用`reportlab`生成PDF报表 - 使用ECharts生成前端图表 -#### Day46 - [日志和调试工具栏](./Day41-55/46.日志和调试工具栏.md) +#### Day51 - [日志和调试工具栏](./Day46-60/51.日志和调试工具栏.md) - 配置日志 - 配置Django-Debug-Toolbar - 优化ORM代码 -#### Day47 - [中间件的应用](./Day41-55/47.中间件的应用.md) +#### Day52 - [中间件的应用](./Day46-60/52.中间件的应用.md) - 什么是中间件 - Django框架内置的中间件 - 自定义中间件及其应用场景 -#### Day48 - [前后端分离开发入门](./Day41-55/48.前后端分离开发入门.md) +#### Day53 - [前后端分离开发入门](./Day46-60/53.前后端分离开发入门.md) - 返回JSON格式的数据 - 用Vue.js渲染页面 -#### Day49 - [RESTful架构和DRF入门](./Day41-55/49.RESTful架构和DRF入门.md) +#### Day54 - [RESTful架构和DRF入门](./Day46-60/54.RESTful架构和DRF入门.md) -#### Day50 - [RESTful架构和DRF进阶](./Day41-55/50.RESTful架构和DRF进阶.md) +- REST概述 +- DRF库使用入门 +- 前后端分离开发 +- JWT的应用 -#### Day51 - [使用缓存](./Day41-55/51.使用缓存.md) +#### Day55 - [RESTful架构和DRF进阶](./Day46-60/55.RESTful架构和DRF进阶.md) + +- 使用CBV +- 数据分页 +- 数据筛选 + +#### Day56 - [使用缓存](./Day46-60/56.使用缓存.md) - 网站优化第一定律 @@ -289,21 +369,21 @@ Python在以下领域都有用武之地。 - 使用装饰器实现页面缓存 - 为数据接口提供缓存服务 -#### Day52 - [接入三方平台](./Day41-55/52.接入三方平台.md) +#### Day57 - [接入三方平台](./Day46-60/57.接入三方平台.md) - 文件上传表单控件和图片文件预览 - 服务器端如何处理上传的文件 -#### Day53 - [异步任务和定时任务](./Day41-55/53.异步任务和定时任务.md) +#### Day58 - [异步任务和定时任务](./Day46-60/58.异步任务和定时任务.md) - 网站优化第二定律 - 配置消息队列服务 - 在项目中使用Celery实现任务异步化 - 在项目中使用Celery实现定时任务 -#### Day54 - [单元测试](./Day41-55/54.单元测试.md) +#### Day59 - [单元测试](./Day46-60/59.单元测试.md) -#### Day55 - [项目上线](./Day41-55/55.项目上线.md) +#### Day60 - [项目上线](./Day46-60/60.项目上线.md) - Python中的单元测试 - Django框架对单元测试的支持 @@ -313,17 +393,6 @@ Python在以下领域都有用武之地。 - 配置HTTPS - 配置域名解析 -### Day56~60 - [用FastAPI开发数据接口](./Day56-60/56-60.用FastAPI开发数据接口.md) - -- FastAPI五分钟上手 -- 请求和响应 -- 接入关系型数据库 -- 依赖注入 -- 中间件 -- 异步化 -- 虚拟化部署(Docker) -- 项目实战:车辆违章查询项目 - ### Day61~65 - [爬虫开发](./Day61-65) #### Day61 - [网络数据采集概述](./Day61-65/61.网络数据采集概述.md) @@ -350,40 +419,148 @@ Python在以下领域都有用武之地。 #### Day64 - [使用Selenium抓取网页动态内容](./Day61-65/64.使用Selenium抓取网页动态内容.md) +- 安装Selenium +- 加载页面 +- 查找元素和模拟用户行为 +- 隐式等待和显示等待 +- 执行JavaScript代码 +- Selenium反爬破解 +- 设置无头浏览器 + #### Day65 - [爬虫框架Scrapy简介](./Day61-65/65.爬虫框架Scrapy简介.md) -### Day66~80 - [数据分析](./Day66-80) +- Scrapy核心组件 +- Scrapy工作流程 +- 安装Scrapy和创建项目 +- 编写蜘蛛程序 +- 编写中间件和管道程序 +- Scrapy配置文件 + +### Day66~80 - 数据分析 #### Day66 - [数据分析概述](./Day66-80/66.数据分析概述.md) +- 数据分析师的职责 +- 数据分析师的技能栈 +- 数据分析相关库 + #### Day67 - [环境准备](./Day66-80/67.环境准备.md) +- 安装和使用anaconda + - conda相关命令 +- 安装和使用jupyter-lab + - 安装和启动 + - 使用小技巧 + #### Day68 - [NumPy的应用-1](./Day66-80/68.NumPy的应用-1.md) +- 创建数组对象 +- 数组对象的属性 +- 数组对象的索引运算 + - 普通索引 + - 花式索引 + - 布尔索引 + - 切片索引 +- 案例:使用数组处理图像 + #### Day69 - [NumPy的应用-2](./Day66-80/69.NumPy的应用-2.md) +- 数组对象的相关方法 + - 获取描述性统计信息 + - 其他相关方法 + #### Day70 - [NumPy的应用-3](./Day66-80/70.NumPy的应用-3.md) +- 数组的运算 + - 数组跟标量的运算 + - 数组跟数组的运算 +- 通用一元函数 +- 通用二元函数 +- 广播机制 +- Numpy常用函数 + #### Day71 - [NumPy的应用-4](./Day66-80/71.NumPy的应用-4.md) +- 向量 +- 行列式 +- 矩阵 +- 多项式 + #### Day72 - [深入浅出pandas-1](./Day66-80/72.深入浅出pandas-1.md) +- 创建`Series`对象 +- `Series`对象的运算 +- `Series`对象的属性和方法 + #### Day73 - [深入浅出pandas-2](./Day66-80/73.深入浅出pandas-2.md) +- 创建`DataFrame`对象 +- `DataFrame`对象的属性和方法 +- 读写`DataFrame`中的数据 + #### Day74 - [深入浅出pandas-3](./Day66-80/74.深入浅出pandas-3.md) +- 数据重塑 + - 数据拼接 + - 数据合并 +- 数据清洗 + - 缺失值 + - 重复值 + - 异常值 + - 预处理 + #### Day75 - [深入浅出pandas-4](./Day66-80/75.深入浅出pandas-4.md) +- 数据透视 + - 获取描述性统计信息 + - 排序和头部值 + - 分组聚合 + - 透视表和交叉表 +- 数据呈现 + #### Day76 - [深入浅出pandas-5](./Day66-80/76.深入浅出pandas-5.md) +- 计算同比环比 +- 窗口计算 +- 相关性判定 + #### Day77 - [深入浅出pandas-6](./Day66-80/77.深入浅出pandas-6.md) +- 索引的使用 + - 范围索引 + - 分类索引 + - 多级索引 + - 间隔索引 + - 日期时间索引 + #### Day78 - [数据可视化-1](./Day66-80/78.数据可视化-1.md) +- 安装和导入matplotlib +- 创建画布 +- 创建坐标系 +- 绘制图表 + - 折线图 + - 散点图 + - 柱状图 + - 饼状图 + - 直方图 + - 箱线图 +- 显示和保存图表 + #### Day79 - [数据可视化-2](./Day66-80/79.数据可视化-2.md) +- 高阶图表 + - 气泡图 + - 面积图 + - 雷达图 + - 玫瑰图 + - 3D图表 + #### Day80 - [数据可视化-3](./Day66-80/80.数据可视化-3.md) +- Seaborn +- Pyecharts + ### Day81~90 - [机器学习和深度学习](./Day81-90) #### Day81 - [机器学习基础](./Day81-90/81.机器学习基础.md) @@ -523,7 +700,7 @@ Python在以下领域都有用武之地。 python manage.py inspectdb > app/models.py ``` -#### 第92天:[Docker容器详解](./Day91-100/92.Docker容器详解.md) +#### 第92天:[Docker容器技术详解](./Day91-100/92.Docker容器技术详解.md) 1. Docker简介 2. 安装Docker @@ -534,8 +711,21 @@ Python在以下领域都有用武之地。 #### 第93天:[MySQL性能优化](./Day91-100/93.MySQL性能优化.md) +1. 基本原则 +2. InnoDB引擎 +3. 索引的使用和注意事项 +4. 数据分区 +5. SQL优化 +6. 配置优化 +7. 架构优化 + #### 第94天:[网络API接口设计](./Day91-100/94.网络API接口设计.md) +- 设计原则 + - 关键问题 + - 其他问题 +- 文档撰写 + #### 第95天:[使用Django开发商业项目](./Day91-100/95.使用Django开发商业项 目.md) ##### 项目开发中的公共问题 @@ -603,6 +793,16 @@ Python在以下领域都有用武之地。 #### 第97天:[电商网站技术要点剖析](./Day91-100/97.电商网站技术要点剖析.md) +1. 商业模式和需求要点 +2. 物理模型设计 +3. 第三方登录 +4. 缓存预热和查询缓存 +5. 购物车的实现 +6. 支付功能集成 +7. 秒杀和超卖问题 +8. 静态资源管理 +9. 全文检索方案 + #### 第98天:[项目部署上线和性能调优](./Day91-100/98.项目部署上线和性能调优.md) 1. MySQL数据库调优 @@ -618,5 +818,12 @@ Python在以下领域都有用武之地。 #### 第99天:[面试中的公共问题](./Day91-100/99.面试中的公共问题.md) +- 计算机基础 +- Python基础 +- Web框架相关 +- 爬虫相关问题 +- 数据分析 +- 项目相关 + #### 第100天:[Python面试题实录](./Day91-100/100.Python面试题实录.md) diff --git a/res/python_study_qq_group.png b/res/python_study_qq_group.png new file mode 100644 index 0000000..d33fa9d Binary files /dev/null and b/res/python_study_qq_group.png differ diff --git a/更新日志.md b/更新日志.md index f7869d7..eb44f80 100755 --- a/更新日志.md +++ b/更新日志.md @@ -1,10 +1,15 @@ ## 更新日志 +### 2024年4月18日 + +1. 重新整理了项目结构,补充了一部分文档。 +2. 准备开始撰写《机器学习和深度学习》部分的内容。 + ### 2022年1月11日 1. 将近期收到的打赏通过水滴筹和众缘普济公益慈善促进会捐赠给有需要的人。 - ![](res/ABF827024EA535099DC0E6A66A336C51.png) + ### 2021年11月22日 @@ -23,11 +28,11 @@ 2. 近期收到的打赏通过美团公益捐赠给有需要的人。 - ![](res/donation6.png) + - ![](res/donation7.png) + - ![](res/donation8.png) + ###2020年10月3日 @@ -43,7 +48,7 @@ 3. 将近期收到的打赏捐赠给陕西回归儿童救助中心。 - ![](res/donation5.png) + ### 2020年4月8日 @@ -53,7 +58,7 @@ 3. 将近期收到的打赏通过腾讯公益捐出,助力“儿童健康课堂”。 - ![](res/donation4.png) + ### 2020年3月8日 @@ -61,7 +66,7 @@ 2. 通过美团公益将近期打赏捐助给受疫情影响儿童。 - ![](res/donation3.png) + ### 2020年3月1日 @@ -77,7 +82,7 @@ 1. 将微信打赏所得收入通过腾讯公益捐赠给国家级贫困大学生。 - ![](./res/donation2.png) + 2. 开始更新和调整第1天到第15天的内容。 @@ -97,7 +102,7 @@ 1. 今天终于结束了出差的日子,回来先把最近收到的打赏通过腾讯公益平台全部捐赠给了绿之叶,总共捐出了111笔打赏。 - ![](./res/donation1.png) + ### 2019年7月9日