master
kenwoodjw 2019-03-05 17:15:30 +08:00
parent b58d0e988b
commit c845f5a976
1 changed files with 278 additions and 75 deletions

263
README.md
View File

@ -119,15 +119,15 @@
* 6.11、请写出匹配ip的Python正则表达式 * 6.11、请写出匹配ip的Python正则表达式
* 6.12、Python里match与search的区别 * 6.12、Python里match与search的区别
* [7、系统编程](#7系统编程) * [7、系统编程](#7系统编程)
* 7.1、进程总结 * 7.1、 进程总结
* 7.2、谈谈你对多进程,多线程,以及协程的理解,项目是否用? * 7.2、 谈谈你对多进程,多线程,以及协程的理解,项目是否用?
* 7.3、Python异步使用场景有那些 * 7.3、 Python异步使用场景有那些
* 7.4、多线程共同操作同一个数据互斥锁同步? * 7.4、 多线程共同操作同一个数据互斥锁同步?
* 7.5、什么是多线程竞争? * 7.5、 什么是多线程竞争?
* 7.6、请介绍一下Python的线程同步 * 7.6、 请介绍一下Python的线程同步
* 7.7、解释一下什么是锁,有哪几种锁? * 7.7、 解释一下什么是锁,有哪几种锁?
* 7.8、什么是死锁呢? * 7.8、 什么是死锁呢?
* 7.9、多线程交互访问数据,如果访问到了就不访问了 * 7.9、 多线程交互访问数据,如果访问到了就不访问了
* 7.10、什么是线程安全,什么是互斥锁? * 7.10、什么是线程安全,什么是互斥锁?
* 7.11、说说下面几个概念:同步,异步,阻塞,非阻塞? * 7.11、说说下面几个概念:同步,异步,阻塞,非阻塞?
* 7.12、什么是僵尸进程和孤儿进程?怎么避免僵尸进程? * 7.12、什么是僵尸进程和孤儿进程?怎么避免僵尸进程?
@ -135,6 +135,7 @@
* 7.14、线程是并发还是并行,进程是并发还是并行? * 7.14、线程是并发还是并行,进程是并发还是并行?
* 7.15、并行parallel和并发concurrency * 7.15、并行parallel和并发concurrency
* 7.16、IO密集型和CPU密集型区别 * 7.16、IO密集型和CPU密集型区别
* 7.17 python asyncio的原理
* 8、网络编程 * 8、网络编程
* 8.1、怎么实现强行关闭客户端和服务器之间的连接? * 8.1、怎么实现强行关闭客户端和服务器之间的连接?
* 8.2、简述TCP和UDP的区别以及优缺点? * 8.2、简述TCP和UDP的区别以及优缺点?
@ -153,30 +154,28 @@
* 8.15、HTTP常见请求头 * 8.15、HTTP常见请求头
* 8.16、七层模型? * 8.16、七层模型?
* 8.17、url的形式 * 8.17、url的形式
* 三、Web * [三、Web](#三.Web)
* 1、Flask * [1、Flask](#1、Flask)
* 1.1、对Flask蓝图(Blueprint)的理解? * 1.1、对Flask蓝图(Blueprint)的理解?
* 1.2、Flask和Django路由映射的区别 * 1.2、Flask和Django路由映射的区别
* Django * Django
* 2.1、什么是wsgi,uwsgi,uWSGI * 2.1、什么是wsgi,uwsgi,uWSGI
* 2.3、CORS和CSRF的区别 * 2.2、CORS和CSRF的区别
* 2.4、Session、Cookie、JWT的理解 * 2.3、Session、Cookie、JWT的理解
* 2.5、简述Django请求生命周期 * 2.4、简述Django请求生命周期
* 2.6、什么是wsgi,uwsgi,uWSGI * 2.5、Django 、Flask、Tornado的对比
* 2.7、Django 、Flask、Tornado的对比 * 2.6、用的restframework完成api发送时间时区
* 2.8、用的restframework完成api发送时间时区 * 2.7、nginx,tomcat,apache 都是什么?
* 2.9、nginx,tomcat,apache 都是什么? * 2.8、请给出你熟悉关系数据库范式有那些,有什么作用
* 2.10、请给出你熟悉关系数据库范式有那些,有什么作用 * 2.9、简述QQ登陆过程
* 2.11、简述QQ登陆过程 * 2.10、post和get 的区别?
* 2.12、post和get 的区别? * 2.11、项目中日志的作用
* 2.13、项目中日志的作用 * 2.12、django中间件的使用
* 2.14、django中间件的使用 * 2.13、谈一下你对uWSGI和 nginx的理解
* 2.15、谈一下你对uWSGI和 nginx的理解 * 2.14、Python中三大框架各自的应用场景
* 2.16、Python中三大框架各自的应用场景 * 2.15、Django中哪里用到了线程?哪里用到了协程?哪里用到了进程?
* 2.17、有过部署经验?用的什么技术?可以满足多少压力? * 2.16、有用过Django REST framework 吗?
* 2.18、Django中哪里用到了线程?哪里用到了协程?哪里用到了进程? * 2.17、对cookie与session的了解他们能单独用吗
* 2.19、有用过Django REST framework 吗?
* 2.20、对cookie与session的了解他们能单独用吗
* 爬虫 * 爬虫
* 1.1、试列出至少三种目前流行的大型数据库 * 1.1、试列出至少三种目前流行的大型数据库
* 1.2、列举您使用过的Python网络爬虫所用到的网络数据包? * 1.2、列举您使用过的Python网络爬虫所用到的网络数据包?
@ -276,7 +275,7 @@
<!-- markdown-toc end --> <!-- markdown-toc end -->
# Python基础 # Python基础
## 1.1 有一个jsonline格式的文件file.txt 大小约为10K ## 1.1 有一个jsonline格式的文件file.txt 大小约为10K
``` ```
def get_lines(): def get_lines():
l = [] l = []
@ -893,3 +892,207 @@ CPU运算量大的程序使用并行会更好
## 7.16 IO密集型和CPU密集型区别 ## 7.16 IO密集型和CPU密集型区别
IO密集型 系统运行大部分的状况是CPU在等 I/O硬盘/内存)的读/写 IO密集型 系统运行大部分的状况是CPU在等 I/O硬盘/内存)的读/写
CPU密集型 大部分时间用来做计算逻辑判断等CPU动作的程序称之CPU密集型。 CPU密集型 大部分时间用来做计算逻辑判断等CPU动作的程序称之CPU密集型。
## 7.17 python asyncio的原理
asyncio这个库就是使用python的yield这个可以打断保存当前函数的上下文的机制 封装好了selector 摆脱掉了复杂的回调关系
# 三.Web
## 1、Flask
## 1.1 对Flask蓝图(Blueprint)的理解?
蓝图的定义
蓝图 /Blueprint 是Flask应用程序组件化的方法可以在一个应用内或跨越多个项目共用蓝图。使用蓝图可以极大简化大型应用的开发难度也为Flask扩展提供了一种在应用中注册服务的集中式机制。
蓝图的应用场景:
把一个应用分解为一个蓝图的集合。这对大型应用是理想的。一个项目可以实例化一个应用对象,初始化几个扩展,并注册一集合的蓝图。
以URL前缀和/或子域名在应用上注册一个蓝图。URL前缀/子域名中的参数即成为这个蓝图下的所有视图函数的共同的视图参数(默认情况下)
在一个应用中用不同的URL规则多次注册一个蓝图。
通过蓝图提供模板过滤器、静态文件、模板和其他功能。一个蓝图不一定要实现应用或视图函数。
初始化一个Flask扩展时在这些情况中注册一个蓝图。
蓝图的缺点:
不能在应用创建后撤销注册一个蓝图而不销毁整个应用对象。
使用蓝图的三个步骤
1.创建一个蓝图对象
```
blue = Blueprint("blue",__name__)
```
2.在这个蓝图对象上进行操作,例如注册路由、指定静态文件夹、注册模板过滤器...
```
@blue.route('/')
def blue_index():
return "Welcome to my blueprint"
```
3.在应用对象上注册这个蓝图对象
```
app.register_blueprint(blue,url_prefix="/blue")
```
## 1.2 Flask 和 Django 路由映射的区别?
在django中路由是浏览器访问服务器时先访问的项目中的url再由项目中的url找到应用中url这些url是放在一个列表里遵从从前往后匹配的规则。在flask中路由是通过装饰器给每个视图函数提供的而且根据请求方式的不同可以一个url用于不同的作用。
## 2、 Django
## 2.1、什么是wsgi,uwsgi,uWSGI?
WSGI:
web服务器网关接口是一套协议。用于接收用户请求并将请求进行初次封装然后将请求交给web框架。
实现wsgi协议的模块wsgiref,本质上就是编写一socket服务端用于接收用户请求django)
werkzeug,本质上就是编写一个socket服务端用于接收用户请求(flask)
uwsgi:
与WSGI一样是一种通信协议它是uWSGI服务器的独占协议用于定义传输信息的类型。
uWSGI:
是一个web服务器实现了WSGI的协议uWSGI协议http协议
## 2.2、 Django、Flask、Tornado的对比
1、 Django走的大而全的方向开发效率高。它的MTV框架自带的ORM,admin后台管理,自带的sqlite数据库和开发测试用的服务器给开发者提高了超高的开发效率。
重量级web框架功能齐全提供一站式解决的思路能让开发者不用在选择上花费大量时间。
自带ORM和模板引擎支持jinja等非官方模板引擎。
自带ORM使Django和关系型数据库耦合度高如果要使用非关系型数据库需要使用第三方库
自带数据库管理app
成熟稳定开发效率高相对于FlaskDjango的整体封闭性比较好适合做企业级网站的开发。python web框架的先驱第三方库丰富
2、 Flask 是轻量级的框架自由灵活可扩展性强核心基于Werkzeug WSGI工具 和jinja2 模板引擎
适用于做小网站以及web服务的API,开发大型网站无压力,但架构需要自己设计
与关系型数据库的结合不弱于Django而与非关系型数据库的结合远远优于Django
3、 Tornado走的是少而精的方向性能优越它最出名的异步非阻塞的设计方式
Tornado的两大核心模块
iostraem:对非阻塞的socket进行简单的封装
ioloop: 对I/O 多路复用的封装,它实现一个单例
## 2.3 CORS 和 CSRF的区别
什么是CORS
CORS是一个W3C标准,全称是“跨域资源共享"(Cross-origin resoure sharing).
它允许浏览器向跨源服务器发出XMLHttpRequest请求从而客服了AJAX只能同源使用的限制。
什么是CSRF
CSRF主流防御方式是在后端生成表单的时候生成一串随机token,内置到表单里成为一个字段同时将此串token置入session中。每次表单提交到后端时都会检查这两个值是否一致以此来判断此次表单提交是否是可信的提交过一次之后如果这个页面没有生成CSRF token,那么token将会被清空,如果有新的需求那么token会被更新。
攻击者可以伪造POST表单提交但是他没有后端生成的内置于表单的tokensession中没有token都无济于事。
## 2.4 Session,Cookie,JWT的理解
为什么要使用会话管理
众所周知HTTP协议是一个无状态的协议也就是说每个请求都是一个独立的请求请求与请求之间并无关系。但在实际的应用场景这种方式并不能满足我们的需求。举个大家都喜欢用的例子把商品加入购物车单独考虑这个请求服务端并不知道这个商品是谁的应该加入谁的购物车因此这个请求的上下文环境实际上应该包含用户的相关信息在每次用户发出请求时把这一小部分额外信息也做为请求的一部分这样服务端就可以根据上下文中的信息针对具体的用户进行操作。所以这几种技术的出现都是对HTTP协议的一个补充使得我们可以用HTTP协议+状态管理构建一个的面向用户的WEB应用。
Session 和Cookie的区别
这里我想先谈谈session与cookies,因为这两个技术是做为开发最为常见的。那么session与cookies的区别是什么个人认为session与cookies最核心区别在于额外信息由谁来维护。利用cookies来实现会话管理时用户的相关信息或者其他我们想要保持在每个请求中的信息都是放在cookies中,而cookies是由客户端来保存每当客户端发出新请求时就会稍带上cookies,服务端会根据其中的信息进行操作。
当利用session来进行会话管理时客户端实际上只存了一个由服务端发送的session_id,而由这个session_id,可以在服务端还原出所需要的所有状态信息,从这里可以看出这部分信息是由服务端来维护的。
除此以外session与cookies都有一些自己的缺点
cookies的安全性不好攻击者可以通过获取本地cookies进行欺骗或者利用cookies进行CSRF攻击。使用cookies时,在多个域名下,会存在跨域问题。
session 在一定的时间里需要存放在服务端因此当拥有大量用户时也会大幅度降低服务端的性能当有多台机器时如何共享session也会是一个问题.(redis集群)也就是说用户第一个访问的时候是服务器A而第二个请求被转发给了服务器B那服务器B如何得知其状态。实际上session与cookies是有联系的比如我们可以把session_id存放在cookies中的。
JWT是如何工作的
首先用户发出登录请求服务端根据用户的登录请求进行匹配如果匹配成功将相关的信息放入payload中利用算法加上服务端的密钥生成token这里需要注意的是secret_key很重要如果这个泄露的话客户端就可以随机篡改发送的额外信息它是信息完整性的保证。生成token后服务端将其返回给客户端客户端可以在下次请求时将token一起交给服务端一般是说我们可以将其放在Authorization首部中这样也就可以避免跨域问题。
## 2.5 简述Django请求生命周期
一般是用户通过浏览器向我们的服务器发起一个请求(request),这个请求会去访问视图函数,如果不涉及到数据调用,那么这个时候视图函数返回一个模板也就是一个网页给用户)
视图函数调用模型毛模型去数据库查找数据,然后逐级返回,视图函数把返回的数据填充到模板中空格中,最后返回网页给用户。
1.wsgi ,请求封装后交给web框架FlaskDjango)
2.中间件对请求进行校验或在请求对象中添加其他相关数据例如csrf,request.session
3.路由匹配 根据浏览器发送的不同url去匹配不同的视图函数
4.视图函数在视图函数中进行业务逻辑的处理可能涉及到ormtemplates
5.中间件,对响应的数据进行处理
6.wsgi将响应的内容发送给浏览器
## 2.6 用的restframework完成api发送时间时区
当前的问题是用django的rest framework模块做一个get请求的发送时间以及时区信息的api
```
class getCurrenttime(APIView):
def get(self,request):
local_time = time.localtime()
time_zone =settings.TIME_ZONE
temp = {'localtime':local_time,'timezone':time_zone}
return Response(temp)
```
## 2.7 nginx,tomcat,apach到都是什么
Nginxengine x)是一个高性能的HTTP和反向代理服务器也是 一个IMAP/POP3/SMTP服务器工作在OSI七层负载的实现方式轮询IP_HASH,fair,session_sticky.
Apache HTTP Server是一个模块化的服务器源于NCSAhttpd服务器
Tomcat 服务器是一个免费的开放源代码的Web应用服务器属于轻量级应用服务器是开发和调试JSP程序的首选。
## 2.8 请给出你熟悉关系数据库范式有哪些,有什么作用?
在进行数据库的设计时,所遵循的一些规范,只要按照设计规范进行设计,就能设计出没有数据冗余和数据维护异常的数据库结构。
数据库的设计的规范有很多,通常来说我们在设是数据库时只要达到其中一些规范就可以了,这些规范又称之为数据库的三范式,一共有三条,也存在着其他范式,我们只要做到满足前三个范式的要求,就能设陈出符合我们的数据库了,我们也不能全部来按照范式的要求来做,还要考虑实际的业务使用情况,所以有时候也需要做一些违反范式的要求。
1.数据库设计的第一范式(最基本),基本上所有数据库的范式都是符合第一范式的,符合第一范式的表具有以下几个特点:
数据库表中的所有字段都只具有单一属性,单一属性的列是由基本的数据类型(整型,浮点型,字符型等)所构成的设计出来的表都是简单的二比表
2.数据库设计的第二范式(是在第一范式的基础上设计的),要求一个表中只具有一个业务主键,也就是说符合第二范式的表中不能存在非主键列对只对部分主键的依赖关系
3.数据库设计的第三范式,指每一个非主属性既不部分依赖与也不传递依赖于业务主键,也就是第二范式的基础上消除了非主属性对主键的传递依赖
## 2.9 简述QQ登陆过程
qq登录在我们的项目中分为了三个接口
第一个接口是请求qq服务器返回一个qq登录的界面;
第二个接口是通过扫码或账号登陆进行验证qq服务器返回给浏览器一个code和state,利用这个code通过本地服务器去向qq服务器获取access_token覆返回给本地服务器凭借access_token再向qq服务器获取用户的openid(openid用户的唯一标识)
第三个接口是判断用户是否是第一次qq登录如果不是的话直接登录返回的jwt-token给用户对没有绑定过本网站的用户对openid进行加密生成token进行绑定
## 2.10 post 和 get的区别》
1.GET是从服务器上获取数据POST是向服务器传送数据
2.在客户端GET方式在通过URL提交数据数据在URL中可以看到POST方式数据放置在HTML——HEADER内提交
3.对于GET方式服务器端用Request.QueryString获取变量的值对于POST方式服务器端用Request.Form获取提交的数据
4.GET方式提交的数据最多只能有1024字节而POST则没有限制
安全性问题,正如在(2)中提到使用GET的时候参数会显示在地址栏上而POST不会。所以如果这些数据是中文数据而且是非敏感数据那么使用GET如果用户输入的数据不是中文字符而且包含敏感数据那么还是使用POST为好
## 2.11 项目中日志的作用
一、日志相关概念
1.日志是一种可以追踪某些软件运行时所发生事件的方法
2.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情
3.一个事件可以用一个包含可选变量数据的消息来描述
4.此外,事件也有重要性的概念,这个重要性也可以被成为严重性级别(level)
二、日志的作用
1.通过log的分析可以方便用户了解系统或软件、应用的运行情况;
2.如果你的应用log足够丰富可以分析以往用户的操作行为、类型喜好地域分布或其他更多信息;
3.如果一个应用的log同时也分了多个级别那么可以很轻易地分析得到该应用的健康状况及时发现问题并快速定位、解决问题补救损失。
4.简单来讲就是我们通过记录和分析日志可以了解一个系统或软件程序运行情况是否正常,也可以在应用程序出现故障时快速定位问题。不仅在开发中,在运维中日志也很重要,日志的作用也可以简单。总结为以下几点:
1.程序调试
2.了解软件程序运行情况,是否正常
3,软件程序运行故障分析与问题定位
4,如果应用的日志信息足够详细和丰富,还可以用来做用户行为分析
## 2.12 django中间件的使用
Django在中间件中预置了六个方法这六个方法的区别在于不同的阶段执行对输入或输出进行干预方法如下
1.初始化:无需任何参数,服务器响应第一个请求的时候调用一次,用于确定是否启用当前中间件
```
def __init__():
pass
```
2.处理请求前在每个请求上调用返回None或HttpResponse对象。
```
def process_request(request):
pass
```
3.处理视图前:在每个请求上调用返回None或HttpResponse对象。
```
def process_view(request,view_func,view_args,view_kwargs):
pass
```
4.处理模板响应前在每个请求上调用返回实现了render方法的响应对象。
```
def process_template_response(request,response):
pass
```
5.处理响应后所有响应返回浏览器之前被调用在每个请求上调用返回HttpResponse对象。
```
def process_response(request,response):
pass
```
6.异常处理当视图抛出异常时调用在每个请求上调用返回一个HttpResponse对象。
```
def process_exception(request,exception):
pass
```
## 2.13 谈一下你对uWSGI和nginx的理解
1.uWSGI是一个Web服务器它实现了WSGI协议、uwsgi、http等协议。Nginx中HttpUwsgiModule的作用是与uWSGI服务器进行交换。WSGI是一种Web服务器网关接口。它是一个Web服务器如nginxuWSGI等服务器与web应用如用Flask框架写的程序通信的一种规范。
要注意WSGI/uwsgi/uWSGI这三个概念的区分。
WSGI是一种通信协议。
uwsgi是一种线路协议而不是通信协议在此常用于在uWSGI服务器与其他网络服务器的数据通信。
uWSGI是实现了uwsgi和WSGI两种协议的Web服务器。
nginx 是一个开源的高性能的HTTP服务器和反向代理
1.作为web服务器它处理静态文件和索引文件效果非常高
2.它的设计非常注重效率最大支持5万个并发连接但只占用很少的内存空间
3.稳定性高,配置简洁。
4.强大的反向代理和负载均衡功能,平衡集群中各个服务器的负载压力应用
## 2.14 Python中三大框架各自的应用场景
django:主要是用来搞快速开发的他的亮点就是快速开发节约成本正常的并发量不过10000,如果要实现高并发的话就要对django进行二次开发比如把整个笨重的框架给拆掉自己写socket实现http的通信,底层用纯c,c++写提升效率ORM框架给干掉自己编写封装与数据库交互的框架,ORM虽然面向对象来操作数据库但是它的效率很低使用外键来联系表与表之间的查询;
flask: 轻量级主要是用来写接口的一个框架实现前后端分离提考开发效率Flask本身相当于一个内核其他几乎所有的功能都要用到扩展(邮件扩展Flask-Mail用户认证Flask-Login),都需要用第三方的扩展来实现。比如可以用Flask-extension加入ORM、文件上传、身份验证等。Flask没有默认使用的数据库你可以选择MySQL也可以用NoSQL。
其WSGI工具箱用Werkzeug(路由模块)模板引擎则使用Jinja2,这两个也是Flask框架的核心。
Tornado Tornado是一种Web服务器软件的开源版本。Tornado和现在的主流Web服务器框架包括大多数Python的框架有着明显的区别它是非阻塞式服务器而且速度相当快。得利于其非阻塞的方式和对epoll的运用Tornado每秒可以处理数以千计的连接因此Tornado是实时Web服务的一个理想框架
## 2.17 Django中哪里用到了线程哪里用到了协程哪里用到了进程
1.Django中耗时的任务用一个进程或者线程来执行比如发邮件使用celery.
2.部署django项目是时候配置文件中设置了进程和协程的相关配置。
## 2.18 有用过Django REST framework吗
Django REST framework是一个强大而灵活的Web API工具。使用RESTframework的理由有
Web browsable API对开发者有极大的好处
包括OAuth1a和OAuth2的认证策略
支持ORM和非ORM数据资源的序列化
全程自定义开发--如果不想使用更加强大的功能可仅仅使用常规的function-based views额外的文档和强大的社区支持
## 2.19 对cookies与session的了解他们能单独用吗
Session采用的是在服务器端保持状态的方案而Cookie采用的是在客户端保持状态的方案。但是禁用Cooki就不能得到Session。因为Session是用Session ID来确定当前对话所对应的服务器Session而Session ID是通过Cookie来传递的禁用Cookie相当于SessionID,也就得不到Session。