Python数据分析与大数据处理从入门到精通,python数据分析与处理

  Python数据分析与大数据处理从入门到精通,python数据分析与处理

  值得一看的Python高效数据处理

  Pandas是Python中非常常用的数据处理工具,使用起来非常方便。它建立在NumPy数组结构上,所以它的许多操作都是由NumPy或Pandas附带的扩展模块编写的。这些模块在Cython中编写编译成C,在C上执行,保证了处理速度。

  今天就来体验一下它的威力吧。

  00-1010您可以使用Panda轻松创建数据。现在让我们创建一个有5列1000行的熊猫数据帧:

  mu1,sigma1=0,0.1

  mu2,sigma2=0.2,0.2

  n=1000df=pd。数据帧(

  {

  a1 : PD . NP . random . normal(mu1,sigma1,n),

  a2 : PD . NP . random . normal(mu2,sigma2,n),

  a3: pd.np.random.randint(0,5,n),

  y1: pd.np.logspace(0,1,num=n),

  y2: pd.np.random.randint(0,2,n),

  }

  )a1和a2:取自正态(高斯)分布的随机样本。A3:从0到4的随机整数。Y1:从0到1的对数标度均匀分布。Y2:从0到1的随机整数。生成如下所示的数据:

  

1.创建数据

Pandas绘图函数返回matplotlib的一个坐标轴(Axes ),所以我们可以在上面自定义绘制我们需要的东西。比如画一条垂直线和一条平行线。这对我们非常有利:

  1.绘制平均线

  2.标记重点的点

  将matplotlib.pyplot作为plt导入

  ax=df.y1.plot()

  ax.axhline(6,color=red ,linestyle= -)

  ax.axvline(775,color=red ,linestyle= -)

  plt.show()

  我们还可以自定义在图表上显示多少个表:

  fig,ax=plt.subplots(2,2,figsize=(14,7))

  df.plot(x=index ,y=y1 ,ax=ax[0,0])

  df.plot.scatter(x=index ,y=y2 ,ax=ax[0,1])

  df.plot.scatter(x=index ,y=a3 ,ax=ax[1,0])

  df.plot(x=index ,y=a1 ,ax=ax[1,1])

  plt.show()

  

2.绘制图像

熊猫使我们能够以非常简单的方式获得两个图形的形状比较:

  df[[a1 , a2]]。绘图(bins=30,kind=hist )

  plt.show()

  也可以允许多图绘制3360。

  df[[a1 , a2]]。情节(bins=30,kind=hist ,支线剧情=真)

  plt.show()

  当然,生成折线图不在画图之下:

  df[[a1 , a2]]。情节(by=df.y2,支线剧情=True)

  plt.show()

  

3.绘制直方图

熊猫也可以用来试衣。让我们用熊猫来找一条最接近下图的直线:

  最小二乘法用于计算到直线的最短距离:

  df[ones]=pd.np.ones(len(df))

  m,c=PD . NP . linalg . lstsq(df[[ index , ones]],df [y1],rcond=none) [0]根据最小二乘法的结果绘制y和拟合的直线:

  df[y]=df[index]。应用(x: x * m c)

  df[[y , y1]]。绘图()

  plt.show()

  感谢您的阅读,希望您能从中获益良多。

  本文转自:https://blog.csdn.net/u010751000/article/details/106735872

  推荐教程:以上《python教程》是值得一看的Python高效数据处理的详细内容。其他相关文章请多关注盛行的IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • oracle的clob大小,oracle clob类型转字符串,Oracle的CLOB大数据字段类型操作方法
  • ,,大数据分析R语言RStudio使用超详细教程
  • 大数据在不同应用场景的价值体现,举例说明大数据应用的场景和优势
  • Python与大数据,python能不能分析大数据
  • 人工智能产业的框架结构分别为,人工智能产业的框架结构的基础层包括大数据
  • Python处理大数据,Python科学计算及大数据
  • 随着ai和大数据技术的发展,对大数据与人工智能的理解
  • 数据开发和大数据开发的区别,大数据开发是啥
  • 应用统计学思考题,应用统计学在大数据背景下的应用与创新
  • hadoop大数据技术基础及应用pdf,基于hadoop的大数据处理技术
  • 大数据技术主要包括哪几方面,大数据技术包括哪些主要内容
  • 与大数据相关的书籍,大数据方面的书籍推荐
  • 数据存储方式,大数据存储的概念是什么,大数据的存储方式包括
  • 学python大数据,Python做大数据
  • 如何成为大数据架构师,大数据架构师发展前景分析,如何成为大数据架构师,大数据架构师发展前景怎么样
  • 留言与评论(共有 条评论)
       
    验证码: