更新了数据分析部分的文档

pull/724/head
jackfrued 2020-12-20 18:41:15 +08:00
parent aa64dfc966
commit ed49ed9a52
2 changed files with 39 additions and 12 deletions

View File

@ -1,8 +1,24 @@
## NumPy的应用
Numpy是一个开源的Python科学计算库**用于快速处理任意维度的数组**。Numpy**支持常见的数组和矩阵操作**对于同样的数值计算任务使用NumPy比直接使用Python不仅代码要简洁的多而且NumPy在性能上远远优于原生Python基本是1到2个数量级的差距数据量越大NumPy的优势就越明显。
Numpy是一个开源的Python科学计算库**用于快速处理任意维度的数组**。Numpy**支持常见的数组和矩阵操作**对于同样的数值计算任务使用NumPy不仅代码要简洁的多而且NumPy的性能远远优于原生Python基本是1个到2个数量级的差距而且数据量越大NumPy的优势就越明显。
Numpy最为核心的数据类型是`ndarray`,使用`ndarray`可以处理一维、二维和多维数组该对象相当于是一个快速而灵活的大数据容器。NumPy底层代码使用C语言编写解决了GIL的限制`ndarray`在存储数据的时候数据与数据的地址都是连续的这样就给使得批量操作数组元素时速度很快远远优于Python中的`list`;另一方面`ndarray`对象提供了更多的方法来处理数据,尤其是和统计相关的方法,这些方法也是原生的`list`没有的。
Numpy最为核心的数据类型是`ndarray`,使用`ndarray`可以处理一维、二维和多维数组该对象相当于是一个快速而灵活的大数据容器。NumPy底层代码使用C语言编写解决了GIL的限制`ndarray`在存储数据的时候数据与数据的地址都是连续的这样就给使得批量操作速度很快远远优于Python中的`list`;另一方面`ndarray`对象提供了更多的方法来处理数据尤其是和统计相关的方法这些方法也是Python原生的`list`没有的。
### 安装和导入NumPy
1. 安装
```Bash
pip install numpy
```
2. 导入
```Python
import numpy as np
```
> **说明**如果已经启动了Notebook但尚未安装NumPy可以在单元格中输入`!pip install numpy `并运行该单元格来安装NumPy安装成功后记得重启Notebook内核来使新安装的库生效。
### 创建数组对象
@ -19,25 +35,32 @@ Numpy最为核心的数据类型是`ndarray`,使用`ndarray`可以处理一维
- 方法五通过numpy.random模块的函数生成随机数创建数组对象
3. 多维数组:跟上面的情况相似,可以通过下面的例子进行了解。
### 数组对象基本属性
### 数组对象属性
1. size属性元素个数
2. shape属性数组的形状
3. dtype属性元素的数据类型
4. ndim属性数组的维度
1. size属性数组元素个数
2. itemsize属性数组单个元素占用内存空间的字节数
3. shape属性数组的形状
4. dtype属性数组元素的数据类型
5. ndim属性数组的维度
6. flat属性数组一维化之后元素的迭代器
7. nbytes属性数组所有元素占用内存空间的字节数
8. base属性数组的基对象如果数组共享了其他数组的内存空间
### 数组对象常用方法
### 数组对象方法
#### 常用方法
#### 统计方法
####其他方法
### 数组的运算
1. 标量运算
2. 矢量运算
### 数组的其他操作
#### 标量运算
#### 矢量运算
#### 广播机制
### 矩阵运算

View File

@ -14,6 +14,10 @@ Pandas核心的数据类型是`Series`、`DataFrame`,分别用于处理一维
#### 绘制图表
#### Index的使用