pandas库的主要功能是数据可视化,pandas可视化excel数据

  pandas库的主要功能是数据可视化,pandas可视化excel数据

  Pandas是python数据处理的一个重要的第三方库。

  进口熊猫作为pd I .熊猫图书馆介绍1。熊猫图书馆数据类型:SeriesDataFrame

  基于上述数据类型的各种操作

  基本运算、算术运算、特征类运算和关联类运算。

  熊猫图书馆和Numpy图书馆的区别:

  NumpyPandas基本数据类型扩展了数据类型,注重数据的结构表达,注重数据的应用表达维度:数据之间的关系维度:数据与索引的关系1.1系列类型Pandas系列类型由一组数据及其相关数据索引组成。

  (1)Series类型的创建

  创建一个列表,索引与列表元素的数量相同:

  自动索引:

  自定义索引:

  index由标量值创建,表示系列类型的大小:

  从字典类型创建,键-值对中的“键”是索引,索引从字典中选择。

  从ndary类型创建,索引和数据可以由ndary类型创建。

  其他函数创建,range()函数等。

  (2)Series类型的基本操作

  系列类型包括索引和值。

  系列类型的操作类似于ndarry类型。

  索引方法相同,数列类型可以使用[]Numpy中的运算和操作。您可以对自定义索引列表进行切片。可以通过自动索引切片,如果有自定义索引,就一起切片。

  系列类型的操作类似于Python字典类型。

  的。get()方法用于通过自定义索引来访问中的保留字。

  系列类型对齐问题:

  系列系列

  数列型在运算中会自动对齐不同指标的数据。

  Series类型的name属性。

  序列对象和索引可以有一个名称,该名称存储在属性中。姓名。

  系列类型的修改

  系列对象可以随时修改并立即生效。

  系列是带有“标签”的一维数组

  索引_ 0-数据_a

  Series的基本操作类似于ndarry和dictionary,按照索引对齐。

  1.2 panda数据帧类型数据帧类型由一组共享相同索引的列组成。

  DataFrame是一种表格数据类型,每一列的值类型可以不同。

  DataFrame既有行索引又有列索引。

  DataFrame常用来表示二维数据,也可以表示多维数据。

  (1)DataFrame类型的创建

  二维ndarray对象:

  由一维数组、列表、字典、元组或序列组成的字典。

  从一维ndarray对象字典创建

  从列表类型的字典创建

  DataFrame是一个带有“标签”的二维数组

  DataFrame的基本操作类似于Series,按行和列进行索引。

  2.2的数据类型操作。熊猫库改系列和DataFrame对象?

  (1)增加或重排:重新索引

  Reindex()可以更改或重新排列Series和DataFrame索引。

  的参数。reindex (index=none,columns=none,…)

  索引类型:

  系列和数据框架索引属于index类型。

  索引对象是不可修改的类型

  索引类型常用方法:

  索引类型的使用:

  (2)删除:drop。drop()可以删除Series和DataFrame指定的行或列索引。

  3.3的数据类型操作。熊猫图书馆(1)算数运算法则

  算术运算基于行和列索引,完成后,算术运算默认生成浮点数。

  补充时间和缺少的项目,以填补NaN

  而一维、一维和零维部分都是广播操作。

  带-*/符号的二元运算产生新对象。

  注:自动完成,NaN表示缺少的项目。

  (2)方法型操作

  不同维度之间有广播操作,一维序列默认参与1轴上的操作。

  使用运算方法使一维数列参与0轴运算。

  (3)比较运算法则

  比较只能比较具有相同索引的元素,没有完成。

  并且广播操作在两个维度、一个维度、一个维度和零维度之间执行。

  使用、=、=、=、=和其他符号来生成布尔对象。

  相同维度操作,相同大小

  不同维度,广播操作,默认为1轴。

  总结:

  Series=index一维数据DataFrame=行列索引二维数据了解数据类型和索引的关系,操作索引就是操作数据。重新索引、数据删除、算术运算和比较运算。将Series和DataFrame对象视为单个数据。二。熊猫数据特征分析1。数据的分类。sort_index()方法根据索引在指定轴上排序,默认为升序。sort_index(轴=0,升序=真)

  的。sort_values()方法根据指定轴上的数值进行排序,默认为升序。

  Series.sort_values(轴=0,升序=真)

  DataFrame.sort_values(by,轴=0,升序=真)

  by:by:轴上的索引或索引列表

  注意:NaN放在排序的末尾。

  2.Pandas统计数据分析适用于系列和数据框架类型:

  适用于系列类型:

  一种方法涵盖所有:

  看一看。描述():

  3.Pandas累积统计分析适用于系列和数据框架类型:

  对于系列和数据框架类型,滚动计算(窗口计算):

  4.相关性分析数据的相关性:

  正相关、负相关、无关相关

  测量相关性的方法:

  (1)协方差:

  (2)皮尔逊相关系数

  r [-1,1]的取值范围

  r的绝对值:

  0.8-1.0高度相关。

  0.6-0.8强相关

  0.4-0.6中度相关

  0.2-0.4弱相关

  0.0-0.2相关性很弱或无相关性

  适用于系列和数据帧类型:

  例证:房价上涨与M2上涨的相关性

  总结:

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: