|
本人计划的职位发展方向是数据科学家。岁月穿梭,无独有偶,在学习的过程中被数学、统计虐了N多遍。无奈之下,只能重新系统的学习微积分、线性代数和统计。
本篇文章是我学习统计过程中的随笔,后续会陆续添加学习统计过程中的其他例子,希望对用python进行统计分析的人有一点小帮助。
本文例子中做直方图主要用到三个库。numpy是基础的多维数组和矩阵操作库;pandas是有金融背景的人开发的,因为其Series、DataFrame等多种便利的高层次数据结构,已经成为python数据分析的利器;matplotlib是python中最强大的可视化库,是做科学计算可视化的标准库。
关于基础环境的搭建,请参考官方文档。
本文中大概思路分成了三部分:
1、使用numpy库模拟构建正态分布数据
2、使用pandas将之前生成的正态分布数据变成DataFrame(类似数据库中的表、Excel中的表格)
3、使用matplotlib绘制相应的直方图
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#1、构建正态分布数据
#mu 均值,sigma 标准差
mu,sigma = 250,2
arr = np.random.normal(mu,sigma,50)
#2、生成DataFrame
df = pd.DataFrame(arr,columns=['val'])
#3、绘制直方图
plt.figure()
df['val'].hist()
file:///C:\Users\zgzs\AppData\Roaming\Tencent\Users\254043715\QQ\WinTemp\RichOle\~~76Q@`B{T8EO`L3GK~`8F4.png
|
-
直方图
|