{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"import numpy as np\n",
"\n",
"import pandas as pd\n",
"# 数据分析BI-------->人工智能AI\n",
"# 数据分析和数据挖掘一个意思,\n",
"# 工具和软件:Excel 免费版\n",
"# SPSS(一人一年10000)、SAS(一人一年5000)、Matlab 收费\n",
"# R、Python(全方位语言,流行) 免费\n",
"# Python + numpy + scipy + pandas + matplotlib + seaborn + pyEcharts + sklearn + kereas(Tensorflow)+…… \n",
"# 代码,自动化(数据输入----输出结果)\n",
"from pandas import Series,DataFrame"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {
"collapsed": true
},
"outputs": [
{
"data": {
"text/plain": [
"a 63\n",
"b 107\n",
"c 16\n",
"d 35\n",
"e 140\n",
"f 83\n",
"dtype: int32"
]
},
"execution_count": 2,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# 多层索引,行列\n",
"# 单层索引\n",
"s = Series(np.random.randint(0,150,size = 6),index=list('abcdef'))\n",
"s"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/plain": [
"张三 期中 114\n",
" 期末 131\n",
"李四 期中 3\n",
" 期末 63\n",
"王五 期中 107\n",
" 期末 34\n",
"dtype: int32"
]
},
"execution_count": 3,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# 多层索引,两层,三层以上(规则一样)\n",
"s2 = Series(np.random.randint(0,150,size = 6),index = pd.MultiIndex.from_product([['张三','李四','王五'],['期中','期末']]))\n",
"s2"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/html": [
"
\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" | \n",
" Python | \n",
" En | \n",
" Math | \n",
"
\n",
" \n",
" \n",
" \n",
" 张三 | \n",
" 期中 | \n",
" 73 | \n",
" 5 | \n",
" 25 | \n",
"
\n",
" \n",
" 期末 | \n",
" 37 | \n",
" 36 | \n",
" 56 | \n",
"
\n",
" \n",
" 李四 | \n",
" 期中 | \n",
" 149 | \n",
" 81 | \n",
" 142 | \n",
"
\n",
" \n",
" 期末 | \n",
" 71 | \n",
" 138 | \n",
" 0 | \n",
"
\n",
" \n",
" 王五 | \n",
" 期中 | \n",
" 11 | \n",
" 94 | \n",
" 103 | \n",
"
\n",
" \n",
" 期末 | \n",
" 25 | \n",
" 121 | \n",
" 83 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Python En Math\n",
"张三 期中 73 5 25\n",
" 期末 37 36 56\n",
"李四 期中 149 81 142\n",
" 期末 71 138 0\n",
"王五 期中 11 94 103\n",
" 期末 25 121 83"
]
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df = DataFrame(np.random.randint(0,150,size = (6,3)),columns=['Python','En','Math'],index =pd.MultiIndex.from_product([['张三','李四','王五'],['期中','期末']]) )\n",
"\n",
"df"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {
"collapsed": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" | \n",
" | \n",
" Python | \n",
" En | \n",
" Math | \n",
"
\n",
" \n",
" \n",
" \n",
" 张三 | \n",
" 期中 | \n",
" A | \n",
" 15 | \n",
" 31 | \n",
" 17 | \n",
"
\n",
" \n",
" B | \n",
" 82 | \n",
" 56 | \n",
" 123 | \n",
"
\n",
" \n",
" 期末 | \n",
" A | \n",
" 14 | \n",
" 2 | \n",
" 78 | \n",
"
\n",
" \n",
" B | \n",
" 69 | \n",
" 50 | \n",
" 17 | \n",
"
\n",
" \n",
" 李四 | \n",
" 期中 | \n",
" A | \n",
" 91 | \n",
" 87 | \n",
" 143 | \n",
"
\n",
" \n",
" B | \n",
" 120 | \n",
" 118 | \n",
" 39 | \n",
"
\n",
" \n",
" 期末 | \n",
" A | \n",
" 56 | \n",
" 76 | \n",
" 55 | \n",
"
\n",
" \n",
" B | \n",
" 11 | \n",
" 105 | \n",
" 121 | \n",
"
\n",
" \n",
" 王五 | \n",
" 期中 | \n",
" A | \n",
" 147 | \n",
" 78 | \n",
" 1 | \n",
"
\n",
" \n",
" B | \n",
" 128 | \n",
" 126 | \n",
" 146 | \n",
"
\n",
" \n",
" 期末 | \n",
" A | \n",
" 49 | \n",
" 45 | \n",
" 114 | \n",
"
\n",
" \n",
" B | \n",
" 121 | \n",
" 26 | \n",
" 77 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Python En Math\n",
"张三 期中 A 15 31 17\n",
" B 82 56 123\n",
" 期末 A 14 2 78\n",
" B 69 50 17\n",
"李四 期中 A 91 87 143\n",
" B 120 118 39\n",
" 期末 A 56 76 55\n",
" B 11 105 121\n",
"王五 期中 A 147 78 1\n",
" B 128 126 146\n",
" 期末 A 49 45 114\n",
" B 121 26 77"
]
},
"execution_count": 5,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# 三层索引\n",
"df3 = DataFrame(np.random.randint(0,150,size = (12,3)),columns=['Python','En','Math'],index =pd.MultiIndex.from_product([['张三','李四','王五'],['期中','期末'],['A','B']]) )\n",
"\n",
"df3"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"73"
]
},
"execution_count": 9,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# 先获取列后获取行\n",
"df['Python']['张三']['期中']"
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {},
"outputs": [],
"source": [
"df2 = df.copy()"
]
},
{
"cell_type": "code",
"execution_count": 16,
"metadata": {
"collapsed": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" | \n",
" Python | \n",
" En | \n",
" Math | \n",
"
\n",
" \n",
" \n",
" \n",
" 张三 | \n",
" 期中 | \n",
" 73 | \n",
" 5 | \n",
" 25 | \n",
"
\n",
" \n",
" 期末 | \n",
" 37 | \n",
" 36 | \n",
" 56 | \n",
"
\n",
" \n",
" 李四 | \n",
" 期中 | \n",
" 149 | \n",
" 81 | \n",
" 142 | \n",
"
\n",
" \n",
" 期末 | \n",
" 71 | \n",
" 138 | \n",
" 0 | \n",
"
\n",
" \n",
" 王五 | \n",
" 期中 | \n",
" 11 | \n",
" 94 | \n",
" 103 | \n",
"
\n",
" \n",
" 期末 | \n",
" 25 | \n",
" 121 | \n",
" 83 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Python En Math\n",
"张三 期中 73 5 25\n",
" 期末 37 36 56\n",
"李四 期中 149 81 142\n",
" 期末 71 138 0\n",
"王五 期中 11 94 103\n",
" 期末 25 121 83"
]
},
"execution_count": 16,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df2.sort_index()"
]
},
{
"cell_type": "code",
"execution_count": 22,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/plain": [
"73"
]
},
"execution_count": 22,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# 先获取行,后获取列\n",
"df.loc['张三'].loc['期中']['Python']"
]
},
{
"cell_type": "code",
"execution_count": 19,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" | \n",
" Python | \n",
" En | \n",
" Math | \n",
"
\n",
" \n",
" \n",
" \n",
" 张三 | \n",
" 期中 | \n",
" 73 | \n",
" 5 | \n",
" 25 | \n",
"
\n",
" \n",
" 期末 | \n",
" 37 | \n",
" 36 | \n",
" 56 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Python En Math\n",
"张三 期中 73 5 25\n",
" 期末 37 36 56"
]
},
"execution_count": 19,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df.iloc[[0,1]]"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.5"
}
},
"nbformat": 4,
"nbformat_minor": 2
}