pandas库用法,pandas库代码

  pandas库用法,pandas库代码

  Pandas是一个易于使用的高性能数据类型和分析工具。

  常用的进口方式进口熊猫作为pd

  Pandas基于numpy,通常与numpy和matplotlib一起使用。

  两种数据类型:系列和数据框架

  基于上述数据类型的各种运算,如基本运算、算术运算、特征运算、关联运算等。

  Numpy:基础数据类型,侧重于数据的结构表达,维度是数据之间的关系。

  熊猫:扩展数据类型,注重数据的应用表达,数据与索引的关系。

  类型系列系列类型由一组数据及其相关数据索引组成。

  进口熊猫当pda=pd。系列([9,8,7,6])打印(a)

  导入熊猫as PDA=pd.series ([9,8,7,6),index=[a , b , c , d]) #自动索引打印(a)

  可以创建的系列类型:

  列出python字典标量值ndarray其他函数基于ipython的交互环境

  字典类型的创建

  从n数组类型创建系列类型

  可以创建数列的类型:-Python list,index与列表元素的个数相同-标量值,index表示数列类型的大小-Python字典,键值对中的键是index,index从字典中执行选择操作-ndarray,index和数据可以通过ndarray type-other函数,range()函数和Series类型的其他基本操作创建。

  系列类型包括索引和值,操作可以类似于ndarray和python字典类型。index来获取索引。值来获取数据。

  Series类型的操作和ndarray类型类似:-index方法相同,在[]- NumPy中的操作和运算可以用于Series类型-可以通过自定义索引的列表切片-可以通过自动索引切片,如果有自定义索引就一起切片。

  Series类型的操作类似于Python字典类型:-按自定义索引访问-operation中的保留字-use。get()方法。

  对齐操作

  数列型在运算中会自动对齐不同指标的数据。

  序列对象和索引可以有一个名称,该名称存储在属性中。姓名。

  系列对象可以随时修改并立即生效。

  Series是一维标签数组。它的基本操作类似于ndarray和dictionary,按照索引对齐。

  数据帧类型数据帧类型由一组共享相同索引的列组成。

  DataFrame是一种表格数据类型,每一列的值类型可以不同。

  DataFrame既有行索引又有列索引。

  DataFrame常用于表示二维数据,但也可以表示多维数据。

  数据帧类型可由以下类型创建:

  二维ndaray对象是由一维ndaray、list、dictionary、tuple或Series组成的字典系列类型。其他数据帧类型是从二维数组对象创建的。

  从一维ndarray对象字典创建

  从列表类型的字典创建

  DataFrame是一个带有“标签”的二维数组。其基本操作类似于Series,按行和列进行索引。

  pandas库的数据类型操作改变Series和DataFrame对象,添加或重排,重新索引,以及删除drop。reindex()可以更改或重新排列Series和DataFrame索引。

  的参数。reindex (index=none,columns=none,…)参数index,新行中的列和列自定义索引fill_value re-index,用于填充缺失位置方法填充方法的值,ffill的当前值向前填充,bfill向后填充。限制最大填充复制默认为真,当一个新对象生成时,如果为假,新老相等将不会被复制。Series和DataFrame的索引属于索引类型,索引对象属于不可修改类型。

  常用的索引类型方法。append(idx)连接另一个索引对象以生成新的索引对。diff(idx)计算差集和一个新的索引对象。交集(idx)计算交集。union(idx)计算联合。delete(loc)删除loc位置的元素。insert(loc,e)在loc位置增加。

  键入操作算数运算法则

  算术运算基于行和列索引,完成后,算术运算默认生成浮点数。

  为缺少的项目填写NaN(空值)。

  并且广播操作在两个维度、一个维度、一个维度和零维度之间执行。

  使用*/符号的二元运算产生新的对象。

  算术运算

  方法的形式操作方法。add(d,**argws)类型间加法,可选参数。sub(d,**argws)类型间减法,可选参数。mul(d,**argws)类型间乘法,可选参数。div(d,**argws)中间类型划分,可选参数

  比较运算

  比较只能比较具有相同索引的元素,没有完成。

  并且广播操作在两个维度、一个维度、一个维度和零维度之间执行。

  领养====!=和其他符号来生成布尔对象。

  Series=索引一维数据

  DataFrame=按行和列索引的二维数据

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: