Python数据分析与大数据处理从入门到精通,python数据分析与处理
值得一看的Python高效数据处理
Pandas是Python中非常常用的数据处理工具,使用起来非常方便。它建立在NumPy数组结构上,所以它的许多操作都是由NumPy或Pandas附带的扩展模块编写的。这些模块在Cython中编写编译成C,在C上执行,保证了处理速度。
今天就来体验一下它的威力吧。
00-1010您可以使用Panda轻松创建数据。现在让我们创建一个有5列1000行的熊猫数据帧:
mu1,sigma1=0,0.1
mu2,sigma2=0.2,0.2
n=1000df=pd。数据帧(
{
a1 : PD . NP . random . normal(mu1,sigma1,n),
a2 : PD . NP . random . normal(mu2,sigma2,n),
a3: pd.np.random.randint(0,5,n),
y1: pd.np.logspace(0,1,num=n),
y2: pd.np.random.randint(0,2,n),
}
)a1和a2:取自正态(高斯)分布的随机样本。A3:从0到4的随机整数。Y1:从0到1的对数标度均匀分布。Y2:从0到1的随机整数。生成如下所示的数据:
1.创建数据
Pandas绘图函数返回matplotlib的一个坐标轴(Axes ),所以我们可以在上面自定义绘制我们需要的东西。比如画一条垂直线和一条平行线。这对我们非常有利:1.绘制平均线
2.标记重点的点
将matplotlib.pyplot作为plt导入
ax=df.y1.plot()
ax.axhline(6,color=red ,linestyle= -)
ax.axvline(775,color=red ,linestyle= -)
plt.show()
我们还可以自定义在图表上显示多少个表:
fig,ax=plt.subplots(2,2,figsize=(14,7))
df.plot(x=index ,y=y1 ,ax=ax[0,0])
df.plot.scatter(x=index ,y=y2 ,ax=ax[0,1])
df.plot.scatter(x=index ,y=a3 ,ax=ax[1,0])
df.plot(x=index ,y=a1 ,ax=ax[1,1])
plt.show()
2.绘制图像
熊猫使我们能够以非常简单的方式获得两个图形的形状比较:df[[a1 , a2]]。绘图(bins=30,kind=hist )
plt.show()
也可以允许多图绘制3360。
df[[a1 , a2]]。情节(bins=30,kind=hist ,支线剧情=真)
plt.show()
当然,生成折线图不在画图之下:
df[[a1 , a2]]。情节(by=df.y2,支线剧情=True)
plt.show()
3.绘制直方图
熊猫也可以用来试衣。让我们用熊猫来找一条最接近下图的直线:最小二乘法用于计算到直线的最短距离:
df[ones]=pd.np.ones(len(df))
m,c=PD . NP . linalg . lstsq(df[[ index , ones]],df [y1],rcond=none) [0]根据最小二乘法的结果绘制y和拟合的直线:
df[y]=df[index]。应用(x: x * m c)
df[[y , y1]]。绘图()
plt.show()
感谢您的阅读,希望您能从中获益良多。
本文转自:https://blog.csdn.net/u010751000/article/details/106735872
推荐教程:以上《python教程》是值得一看的Python高效数据处理的详细内容。其他相关文章请多关注盛行的IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。