pandas的基本数据结构,pandas的三种数据结构

  pandas的基本数据结构,pandas的三种数据结构

  Pandas中有三种数据结构:Series、DataFrame和MultiIndex(旧版中称为Panel)。Series是一维数据结构,DataFrame是二维表格数据结构,MultiIndex是三维数据结构。本文将详细讲解这三种数据结构,有需要的可以参考。

  00-1010 1熊猫介绍2熊猫数据结构2.1系列2.2数据框架

  

目录

 

  WesMcKinney在2008年开发的库

  用于数据挖掘的开源python库

  在Numpy的基础上,利用Numpy模块的高计算性能。

  基于matplotlib,可以轻松画图。

  唯一数据结构

  Numpy已经能够帮助我们处理数据,结合matplotlib解决一些数据显示等问题。那么熊猫学习的目的是什么呢?

  增强图表的可读性和便捷的数据处理能力。读取文件方便打包Matplotlib和Numpy的绘图和计算。

  

1 Pandas介绍

 

  Pandas中有三种数据结构:Series、DataFrame和MultiIndex(旧版中称为Panel)。

  Series是一维数据结构,DataFrame是二维表格数据结构,MultiIndex是三维数据结构。

  

2 Pandas数据结构

 

  数列是一种类似一维数组的数据结构。它可以保存任何类型的数据,如整数、字符串、浮点数等。它主要由一组数据及其相关索引组成。

  2.1.1 Series的创建

  #进口熊猫

  进口熊猫作为pd

  警察。系列(数据=无,索引=无,数据类型=无)

  参数:

  Data:传入的数据,可以是index: index,如ndarray和list,必须是唯一的,并且等于数据的长度。如果没有传入索引参数,默认情况下将自动创建一个从0到N的整数索引。Dtype:指定索引创建的数据类型:

  警察。数列([6.7,5.6,3,10,2],索引=[1,2,3,4,5])

  由字典数据创建

  color_count=pd系列({ 红色 :100,蓝色 :200,绿色 : 500,黄色 :1000})

  颜色计数

  2.1.2 Series的属性

  为了更方便地操作Series对象中的索引和数据,Series提供了两个属性index和values。

  1 .索引

  颜色计数.索引

  #结果

  索引([蓝色,绿色,红色,黄色],dtype=object )

  2 .价值观

  颜色计数值

  #结果

  数组([ 200,500,100,1000])

  当然,您也可以使用索引来获取数据:

  颜色计数[2]

  #结果

  100

  

2.1 Series

 

  DataFrame是一个类似于二维数组或表格(如excel)的对象,它同时具有行索引和列索引。

  行索引,表示不同的行,水平索引,称为索引,轴0,轴=0列索引,表名不同的列,垂直索引,称为列,轴1,轴=12.2.1 DataFrame的创建.

  #进口熊猫

  进口熊猫作为

   pd

  pd.DataFrame(data=None, index=None, columns=None)

  

  参数:

  

  • index:行标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。

  • columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。

 

  举例:创建学生成绩表

  

# 生成10名同学,5门功课的数据

 

  但是这样的数据形式很难看到存储的是什么的样的数据,可读性比较差!!

  问题:如何让数据更有意义的显示?

  

# 使用Pandas中的数据结构

 

  

 

  增加行、列索引:

  

# 构造行索引序列

 

  

 

  2.2.2 DataFrame的属性

  1.shape

  

data.shape

 

  2.index

  DataFrame的行索引列表

  

data.index

 

  3.columns

  DataFrame的列索引列表

  

data.columns

 

  4.values

  直接获取其中array的值

  

data.values

 

  5.T

  转置

  

data.T

 

  输出结果:

  

 

  6.head(5):显示前5行内容 (很常用)

  如果不补充参数,默认5行。填入参数N则显示前N行

  

data.head(5)

 

  7.tail(5):显示后5行内容

  如果不补充参数,默认5行。填入参数N则显示后N行

  

data.tail(5)

 

  2.2.3 DatatFrame索引的设置

  1.修改行列索引值

  

stu = ["学生_" + str(i) for i in range(score_df.shape[0])]

 

  注意:以下修改方式是错误的

  

# 错误修改方式

 

  2.重设索引

  reset_index(drop=False)

  

  • 设置新的下标索引

  • drop:默认为False,不删除原来索引,如果为True,删除原来的索引值

 

  

# 重置索引,drop=False

 

  3.以某列值设置为新的索引

  set_index(keys, drop=True)

  

  • keys : 列索引名成或者列索引名称的列表

  • drop : boolean, default True.当做新的索引,删除原来的列

 

  

df = pd.DataFrame({month: [1, 4, 7, 10],

 

  注:通过刚才的设置,这样DataFrame就变成了一个具有MultiIndex的DataFrame。

  到此这篇关于Python Pandas学习之Pandas数据结构详解的文章就介绍到这了,更多相关Python Pandas数据结构内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • mysql复合索引和组合索引,mysql组合索引数据结构
  • mysql复合索引和组合索引,mysql组合索引数据结构,Mysql之组合索引方法详解
  • mysql复合索引和组合索引,mysql复合索引数据结构
  • mysql复合索引和组合索引,mysql复合索引数据结构,MySQL的复合索引总结
  • b+树 多路搜索树,数据结构中树的分类
  • b+树 多路搜索树,数据结构中树的分类,数据结构-树(三):多路搜索树B树、B+树
  • avl树的构造,avl树特性,数据结构之AVL树详解
  • 数据结构c语言哈夫曼树,c语言哈夫曼树的构造,使用C语言详解霍夫曼树数据结构
  • c语言数据结构算法编程库,数据结构 c语言中文网
  • c语言数据结构算法编程库,数据结构 c语言中文网,C语言编程数据结构基础详解小白篇
  • c++纸牌游戏,数据结构纸牌游戏c语言
  • c++纸牌游戏,数据结构纸牌游戏c语言,C语言实战之纸牌游戏
  • ,,c#解析jobject的数据结构
  • ,,javascript数据结构之多叉树经典操作示例【创建、添加、遍历、移除等】
  • ,,Java 数据结构与算法系列精讲之背包问题
  • 留言与评论(共有 条评论)
       
    验证码: