2018-12-27 00:37:27 +08:00
## 关系数据库入门
2018-05-22 13:19:13 +08:00
2018-12-27 00:37:27 +08:00
### 关系数据库概述
1. 数据持久化 - 将数据保存到(在掉电情况下)能够长久保存数据的存储介质中。
2. 数据库发展史 - 网状数据库、层次数据库、关系数据库。
> 1970年, IBM的研究员E.F.Codd在*Communication of the ACM*上发表了名为*A Relational Model of Data for Large Shared Data Banks*的论文, 提出了关系模型的概念, 奠定了关系模型的理论基础。后来Codd又陆续发表多篇文章, 论述了范式理论和衡量关系系统的12条标准, 用数学理论奠定了关系数据库的基础。
3. 关系数据库特点。
2018-05-22 13:19:13 +08:00
2018-06-25 23:30:17 +08:00
- 理论基础:集合论和关系代数。
2018-12-27 00:37:27 +08:00
2018-06-25 23:30:17 +08:00
- 具体表象:用二维表(有行和列)组织数据。
2018-12-27 00:37:27 +08:00
2018-06-25 23:30:17 +08:00
- 编程语言: 结构化查询语言( SQL) 。
2018-12-27 00:37:27 +08:00
2018-05-22 13:19:13 +08:00
4. E-R图。
2018-06-26 23:35:05 +08:00
- 实体 - 矩形框
- 属性 - 椭圆框
- 关系 - 菱形框
- 重数 - 1:1 / 1:N / M:N
2018-12-27 00:37:27 +08:00
5. 关系数据库产品。
- [Oracle ](https://www.oracle.com/index.html ) - 目前世界上使用最为广泛的数据库管理系统, 作为一个通用的数据库系统, 它具有完整的数据管理功能; 作为一个关系数据库, 它是一个完备关系的产品; 作为分布式数据库, 它实现了分布式处理的功能。在Oracle最新的12c版本中, 还引入了多承租方架构, 使用该架构可轻松部署和管理数据库云。
- [DB2 ](https://www.ibm.com/analytics/us/en/db2/ ) - IBM公司开发的、主要运行于Unix( 包括IBM自家的[AIX](https://zh.wikipedia.org/wiki/AIX)) 、Linux、以及Windows服务器版等系统的关系数据库产品。DB2历史悠久且被认为是最早使用SQL的数据库产品, 它拥有较为强大的商业智能功能。
- [SQL Server ](https://www.microsoft.com/en-us/sql-server/ ) - 由Microsoft开发和推广的关系型数据库产品, 最初适用于中小企业的数据管理, 但是近年来它的应用范围有所扩展, 部分大企业甚至是跨国公司也开始基于它来构建自己的数据管理系统。
- [MySQL ](https://www.mysql.com/ ) - MySQL是开放源代码的, 任何人都可以在GPL( General Public License) 的许可下下载并根据个性化的需要对其进行修改。MySQL因为其速度、可靠性和适应性而备受关注。
- [PostgreSQL]() - 在BSD许可证下发行的开发源代码的关系数据库产品。
2018-05-22 13:19:13 +08:00
### MySQL简介
1. 安装和配置。
2. 常用命令。
### SQL详解
1. DDL
2018-06-25 23:30:17 +08:00
```SQL
2018-06-26 23:35:05 +08:00
-- 创建数据库SRS
2018-06-25 23:30:17 +08:00
drop database if exists SRS;
create database SRS default charset utf8;
2018-06-26 23:35:05 +08:00
-- 切换到SRS
2018-06-25 23:30:17 +08:00
use SRS;
2018-06-26 23:35:05 +08:00
-- 创建学院表
create table tb_college
(
collid int not null auto_increment comment '学院编号',
collname varchar(50) not null comment '学院名称',
collmaster varchar(20) not null comment '院长姓名',
collweb varchar(511) default '' comment '学院网站',
primary key (collid)
);
-- 添加唯一性约束
alter table tb_college add constraint uni_college_collname unique (collname);
-- alter table tb_college drop index uni_college_collname;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 创建学生表
create table tb_student
2018-06-25 23:30:17 +08:00
(
2018-06-26 23:35:05 +08:00
stuid int not null comment '学号',
stuname varchar(20) not null comment '学生姓名',
stusex bit default 1 comment '性别',
stubirth date not null comment '出生日期',
stuaddr varchar(255) default '' comment '籍贯',
collid int not null comment '所属学院编号',
2018-06-25 23:30:17 +08:00
primary key (stuid)
);
2018-06-26 23:35:05 +08:00
-- 添加外键约束
alter table tb_student add constraint fk_student_collid foreign key (collid) references tb_college (collid);
-- 创建教师表
create table tb_teacher
(
teacherid int not null comment '教师工号',
tname varchar(20) not null comment '教师姓名',
ttitle varchar(10) default '' comment '职称',
collid int not null comment '所属学院编号'
);
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 添加主键约束
alter table tb_teacher add constraint pk_teacher primary key (teacherid);
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 添加外键约束
alter table tb_teacher add constraint fk_teacher_collid foreign key (collid) references tb_college (collid);
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 创建课程表
create table tb_course
2018-06-25 23:30:17 +08:00
(
2018-06-26 23:35:05 +08:00
courseid int not null comment '课程编号',
cname varchar(50) not null comment '课程名称',
ccredit tinyint not null comment '学分',
tid int not null comment '教师工号',
primary key (courseid)
2018-06-25 23:30:17 +08:00
);
2018-06-26 23:35:05 +08:00
-- 添加外键约束
alter table tb_course add constraint fk_course_tid foreign key (tid) references tb_teacher (teacherid);
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 创建学生选课表
create table tb_score
2018-06-25 23:30:17 +08:00
(
2018-06-26 23:35:05 +08:00
scid int not null auto_increment comment '选课编号',
sid int not null comment '学号',
cid int not null comment '课程编号',
selectdate datetime comment '选课时间日期',
score decimal(4,1) comment '考试成绩',
primary key (scid)
2018-06-25 23:30:17 +08:00
);
2018-06-26 23:35:05 +08:00
-- 添加检查约束(MySQL中检查约束不生效)
alter table tb_score add constraint ck_score_score check (score between 0 and 100);
-- 添加外键约束
alter table tb_score add constraint fk_score_sid foreign key (sid) references tb_student (stuid);
alter table tb_score add constraint fk_score_cid foreign key (cid) references tb_course (courseid);
2018-06-25 23:30:17 +08:00
```
2018-05-22 13:19:13 +08:00
2. DML
2018-06-25 23:30:17 +08:00
```SQL
2018-06-26 23:35:05 +08:00
-- 插入学院数据
insert into tb_college
(collname, collmaster, collweb) values
('计算机学院', '左冷禅', 'http://www.abc.com'),
('外国语学院', '岳不群', 'http://www.xyz.com'),
('经济管理学院', '风清扬', 'http://www.foo.com');
-- 插入学生数据
insert into tb_student
(stuid, stuname, stusex, stubirth, stuaddr, collid) values
(1001, '向问天', 1, '1990-3-4', '四川成都', 1),
(1002, '任我行', 1, '1992-2-2', '湖南长沙', 1),
(1033, '任盈盈', 0, '1989-12-3', '湖南长沙', 1),
(1572, '余沧海', 1, '1993-7-19', '四川成都', 1),
(1378, '岳灵珊', 0, '1995-8-12', '四川绵阳', 1),
(1954, '林平之', 1, '1994-9-20', '福建莆田', 1),
(2035, '令狐冲', 1, '1988-6-30', '陕西咸阳', 2),
(3011, '林震南', 1, '1985-12-12', '福建莆田', 3),
(3755, '龙傲天', 1, '1993-1-25', '广东东莞', 3),
(3923, '向天问', 0, '1985-4-17', '四川成都', 3),
(2177, '隔壁老王', 1, '1989-11-27', '四川成都', 2);
-- 插入老师数据
insert into tb_teacher
(teacherid, tname, ttitle, collid) values
(1122, '张三丰', '教授', 1),
(1133, '宋远桥', '副教授', 1),
(1144, '杨逍', '副教授', 1),
(2255, '范遥', '副教授', 2),
(3366, '韦一笑', '讲师', 3);
-- 插入课程数据
insert into tb_course
(courseid, cname, ccredit, tid) values
(1111, 'Python程序设计', 3, 1122),
(2222, 'Web前端开发', 2, 1122),
(3333, '操作系统', 4, 1122),
(4444, '计算机网络', 2, 1133),
(5555, '编译原理', 4, 1144),
(6666, '算法和数据结构', 3, 1144),
(7777, '经贸法语', 3, 2255),
(8888, '成本会计', 2, 3366),
(9999, '审计', 3, 3366);
-- 插入选课数据
insert into tb_score
(sid, cid, selectdate, score) values
(1001, 1111, now(), 95),
(1001, 2222, now(), 87.5),
(1001, 3333, now(), 100),
(1001, 4444, now(), null),
(1001, 6666, now(), 100),
(1002, 1111, now(), 65),
(1002, 5555, now(), 42),
(1033, 1111, now(), 92.5),
(1033, 4444, now(), 78),
(1033, 5555, now(), 82.5),
(1572, 1111, now(), 78),
(1378, 1111, now(), 82),
(1378, 7777, now(), 65.5),
(2035, 7777, now(), 88),
(2035, 9999, now(), 70),
(3755, 1111, now(), 72.5),
(3755, 8888, now(), 93),
(3755, 9999, now(), null);
-- 删除数据
delete from tb_student where stuid=2177;
-- 更新数据
update tb_score set score=null where sid=1002 and cid=1111;
2018-06-25 23:30:17 +08:00
```
2018-05-22 13:19:13 +08:00
3. DQL
2018-06-25 23:30:17 +08:00
```SQL
-- 查询所有学生信息
2018-06-26 23:35:05 +08:00
select * from tb_student;
select stuid, stuname, stusex, stubirth, stuaddr, collid
from tb_student;
2018-06-25 23:30:17 +08:00
-- 查询所有课程名称及学分(投影和别名)
2018-06-26 23:35:05 +08:00
select cname as 课程名称, ccredit as 学分 from tb_course;
2018-06-25 23:30:17 +08:00
-- 查询所有女学生的姓名和出生日期(筛选)
2018-06-26 23:35:05 +08:00
select stuname, stubirth from tb_student where stusex=0;
-- 查询所有80后女学生的姓名、性别(显示成'女')和出生日期(筛选)
select stuname, '女' as stusex, stubirth from tb_student
where stubirth between '1980-1-1' and '1989-12-31' and stusex=0;
-- 查询姓“林”的学生姓名和性别(模糊)
select stuname, if(stusex, '男', '女') as stusex
from tb_student where stuname like '林%';
-- 查询姓“张”名字总共两个字的老师的姓名和职称(模糊)
select tname from tb_teacher where tname like '张_';
-- 查询姓“张”名字总共三个字的老师的姓名和职称(模糊)
select tname, ttitle from tb_teacher where tname like '张__';
-- 查询名字中有“天”字的学生的姓名(模糊)
select stuname from tb_student where stuname like '%天%';
2018-06-29 18:01:16 +08:00
-- 查询学生的籍贯(去重)
2018-06-26 23:35:05 +08:00
select distinct stuaddr from tb_student
where stuaddr< >'' and stuaddr is not null;
-- 查询男学生的姓名和生日按年龄从大到小排列(排序)
select stuname, stubirth from tb_student
where stusex=1 order by stubirth asc;
-- 查询年龄最大/最小的学生的出生日期(聚合函数)
select min(stubirth) from tb_student;
select max(stubirth) from tb_student;
-- 查询学生/男学生/女学生的总人数
select count(stuid) from tb_student;
select count(stuid) from tb_student where stusex=1;
select count(stuid) from tb_student where stusex=0;
-- 查询1111课程的平均分/最低分/最高分/选课人数/考试人数
select avg(score) from tb_score where cid=1111;
select min(score) from tb_score where cid=1111;
select max(score) from tb_score where cid=1111;
select count(sid) from tb_score where cid=1111;
select count(score) from tb_score where cid=1111;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询男女学生的人数(分组和聚合函数)
select if(stusex, '男', '女') as 性别, count(stusex) as 人数
from tb_student group by stusex order by 人数 desc;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询学号为1001的学生所有课程的总成绩(筛选和聚合函数)
select sum(score) as 总成绩 from tb_score where sid=1001;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询每个学生的学号和平均成绩(分组和聚合函数)
2018-06-29 18:01:16 +08:00
select sid as 学号, avg(score) as 平均分 from tb_score
2018-06-26 23:35:05 +08:00
where score is not null
group by sid
order by 平均分 desc;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询平均成绩大于等于80分的学生的学号和平均成绩(分组后的筛选)
2018-06-29 18:01:16 +08:00
select sid as 学号, avg(score) as 平均分 from tb_score
2018-06-26 23:35:05 +08:00
group by sid having 平均分>=80
order by 平均分 desc;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询年龄最大的学生的姓名(子查询)
select stuname from tb_student
where stubirth=(select min(stubirth) from tb_student);
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询选了三门及以上的课程的学生姓名(子查询/分组条件/集合运算)
select stuname from tb_student where stuid in
(select sid from tb_score group by sid having count(sid)>=3);
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询课程名称、学分、授课老师的名字和职称
select cname, ccredit, tname, ttitle
from tb_course, tb_teacher
where tid=teacherid;
2018-06-25 23:30:17 +08:00
2018-06-29 18:01:16 +08:00
select cname, ccredit, tname, ttitle from tb_course
inner join tb_teacher on tid=teacherid;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询学生姓名和所在学院名称
select stuname, collname
from tb_student t1, tb_college t2
where t1.collid=t2.collid;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
select stuname, collname from tb_student t1
inner join tb_college t2 on t1.collid=t2.collid;
2018-06-25 23:30:17 +08:00
2018-06-26 23:35:05 +08:00
-- 查询学生姓名、课程名称以及考试成绩
2018-06-29 18:01:16 +08:00
select stuname, cname, score
from tb_student, tb_course, tb_score
where stuid=sid and courseid=cid
and score is not null;
2018-06-25 23:30:17 +08:00
2018-06-29 18:01:16 +08:00
select stuname, cname, score from tb_student
inner join tb_score on stuid=sid
inner join tb_course on courseid=cid
where score is not null;
2018-06-25 23:30:17 +08:00
-- 查询选课学生的姓名和平均成绩(子查询和连接查询)
2018-06-29 18:01:16 +08:00
select stuname, avgscore from tb_student,
(select sid, avg(score) as avgscore from tb_score
group by sid) temp where sid=stuid;
2018-06-26 23:35:05 +08:00
2018-06-29 18:01:16 +08:00
select stuname, avgscore from tb_student
inner join (select sid, avg(score) as avgscore
from tb_score group by sid) temp on sid=stuid;
2018-06-25 23:30:17 +08:00
-- 查询每个学生的姓名和选课数量(左外连接和子查询)
2018-06-29 18:01:16 +08:00
select stuname as 姓名, ifnull(total, 0) as 选课数量
from tb_student left outer join (select sid, count(sid) as total
from tb_score group by sid) temp on stuid=sid;
2018-06-25 23:30:17 +08:00
```
4. DCL
```SQL
-- 创建名为hellokitty的用户
create user 'hellokitty'@'localhost' identified by '123123';
-- 将对SRS数据库所有对象的所有操作权限授予hellokitty
grant all privileges on SRS.* to 'hellokitty'@'localhost';
-- 召回hellokitty对SRS数据库所有对象的insert/delete/update权限
revoke insert, delete, update on SRS.* from 'hellokitty'@'localhost';
```
2018-06-26 23:35:05 +08:00
### 相关知识
#### 范式理论
#### 数据完整性
1. 实体完整性 - 每个实体都是独一无二的
- 主键 / 唯一约束 / 唯一索引
2. 引用完整性(参照完整性)
- 外键
3. 域完整性 - 数据是有效的
- 数据类型
- 非空约束
- 默认值约束
- 检查约束
2018-05-22 13:19:13 +08:00
### Python数据库编程
2019-02-13 07:38:52 +08:00
我们用如下所示的数据库来演示在Python中如何访问MySQL数据库。
2018-12-27 00:37:27 +08:00
2019-02-13 07:38:52 +08:00
```SQL
drop database if exists hrs;
create database hrs default charset utf8;
use hrs;
drop table if exists tb_emp;
drop table if exists tb_dept;
create table tb_dept
(
dno int not null comment '编号',
dname varchar(10) not null comment '名称',
dloc varchar(20) not null comment '所在地',
primary key (dno)
);
insert into tb_dept values
(10, '会计部', '北京'),
(20, '研发部', '成都'),
(30, '销售部', '重庆'),
(40, '运维部', '深圳');
create table tb_emp
(
eno int not null comment '员工编号',
ename varchar(20) not null comment '员工姓名',
job varchar(20) not null comment '员工职位',
mgr int comment '主管编号',
sal int not null comment '员工月薪',
comm int comment '每月补贴',
dno int comment '所在部门编号',
primary key (eno)
);
alter table tb_emp add constraint fk_emp_dno foreign key (dno) references tb_dept (dno);
insert into tb_emp values
(7800, '张三丰', '总裁', null, 9000, 1200, 20),
(2056, '乔峰', '分析师', 7800, 5000, 1500, 20),
(3088, '李莫愁', '设计师', 2056, 3500, 800, 20),
(3211, '张无忌', '程序员', 2056, 3200, null, 20),
(3233, '丘处机', '程序员', 2056, 3400, null, 20),
(3251, '张翠山', '程序员', 2056, 4000, null, 20),
(5566, '宋远桥', '会计师', 7800, 4000, 1000, 10),
(5234, '郭靖', '出纳', 5566, 2000, null, 10),
(3344, '黄蓉', '销售主管', 7800, 3000, 800, 30),
(1359, '胡一刀', '销售员', 3344, 1800, 200, 30),
(4466, '苗人凤', '销售员', 3344, 2500, null, 30),
(3244, '欧阳锋', '程序员', 3088, 3200, null, 20),
(3577, '杨过', '会计', 5566, 2200, null, 10),
(3588, '朱九真', '会计', 5566, 2500, null, 10);
```
在Python 3中, 我们通常使用纯Python的三方库PyMySQL来访问MySQL数据库, 它应该是目前最好的选择。
1. 安装PyMySQL。
```Shell
pip install pymysql
```
2. 添加一个部门。
```Python
import pymysql
def main():
no = int(input('编号: '))
name = input('名字: ')
loc = input('所在地: ')
# 1. 创建数据库连接对象
con = pymysql.connect(host='localhost', port=3306,
database='hrs', charset='utf8',
user='root', password='123456')
try:
# 2. 通过连接对象获取游标
with con.cursor() as cursor:
# 3. 通过游标执行SQL并获得执行结果
result = cursor.execute(
'insert into tb_dept values (%s, %s, %s)',
(no, name, loc)
)
if result == 1:
# 4. 操作成功提交事务
con.commit()
print('添加成功!')
finally:
# 5. 关闭连接释放资源
con.close()
if __name__ == '__main__':
main()
```
3. 删除一个部门。
```Python
import pymysql
def main():
no = int(input('编号: '))
con = pymysql.connect(host='localhost', port=3306,
database='hrs', charset='utf8',
user='root', password='123456',
autocommit=True)
try:
with con.cursor() as cursor:
result = cursor.execute(
'delete from tb_dept where dno=%s',
(no, )
)
if result == 1:
print('删除成功!')
finally:
con.close()
if __name__ == '__main__':
main()
```
4. 更新一个部门。
```Python
import pymysql
def main():
no = int(input('编号: '))
name = input('名字: ')
loc = input('所在地: ')
con = pymysql.connect(host='localhost', port=3306,
database='hrs', charset='utf8',
user='root', password='123456',
autocommit=True)
try:
with con.cursor() as cursor:
result = cursor.execute(
'update tb_dept set dname=%s, dloc=%s where dno=%s',
(name, loc, no)
)
if result == 1:
print('更新成功!')
finally:
con.close()
if __name__ == '__main__':
main()
```
5. 查询所有部门。
```Python
import pymysql
from pymysql.cursors import DictCursor
def main():
con = pymysql.connect(host='localhost', port=3306,
database='hrs', charset='utf8',
user='root', password='123456')
try:
with con.cursor(cursor=DictCursor) as cursor:
cursor.execute('select dno as no, dname as name, dloc as loc from tb_dept')
results = cursor.fetchall()
print(results)
print('编号\t名称\t\t所在地')
for dept in results:
print(dept['no'], end='\t')
print(dept['name'], end='\t')
print(dept['loc'])
finally:
con.close()
if __name__ == '__main__':
main()
```
6. 分页查询员工信息。
```Python
import pymysql
from pymysql.cursors import DictCursor
class Emp(object):
def __init__ (self, no, name, job, sal):
self.no = no
self.name = name
self.job = job
self.sal = sal
def __str__ (self):
return f'\n编号: {self.no}\n姓名: {self.name}\n职位: {self.job}\n月薪: {self.sal}\n'
def main():
page = int(input('页码: '))
size = int(input('大小: '))
con = pymysql.connect(host='localhost', port=3306,
database='hrs', charset='utf8',
user='root', password='123456')
try:
with con.cursor() as cursor:
cursor.execute(
'select eno as no, ename as name, job, sal from tb_emp limit %s,%s',
((page - 1) * size, size)
)
for emp_tuple in cursor.fetchall():
emp = Emp(*emp_tuple)
print(emp)
finally:
con.close()
if __name__ == '__main__':
main()
```