python中的pandas是什么,pandas用来做什么

  python中的pandas是什么,pandas用来做什么

  在[24]: s4[s4 9000]

  Out[24]:

  数学9001.0

  数据类型:float64

  系列就简单写到这里。再来看熊猫的另一种数据结构DataFrame。

  数据帧

  DataFrame是一种二维数据结构,非常接近于电子表格或类似mysql的数据库。它的竖线叫分栏,横线和前面的系列一样叫索引,意思是一个主句的位置可以通过分栏和索引来确定。

  首先导入模块。

  [27]:摘自熊猫进口系列,数据框

  In [26]: data={name:[google ,百度, yahoo], marks:[100,200,300], price:[1,2,3]}

  在[28]中:f1=数据帧(数据)

  在[29]: f1

  Out[29]:

  商标名称价格

  0 100谷歌1

  1 200百度2

  2 300雅虎3

  这是定义DataFrame对象的常用方法。——由dict定义。字典的“键”(“名称”、“标记”、“价格”)是DataFrame的列的值(名称)。字典中每个“键”的值是一个列表,它们是该垂直列中的特定填充数据。指数在上面的定义中没有确定,所以按照惯例(已经串联形成的惯例)是从0开始的整数。从上面的结果可以明显看出,这是一个二维的数据结构(类似于excel或者mysql中的查看效果)。

  在上面的数据显示中,没有指定列的顺序,就像字典中键的顺序一样。但是,在DataFrame中,列明显不同于字典键,也就是说,它们的顺序是可以指定的。请按如下方式操作:

  In [31]: f2=DataFrame(data,columns=[name , price , marks])

  在[32]: f2

  Out[32]:

  名称价格标记

  0谷歌1 100

  1百度2 200

  2雅虎3 300

  与Series类似,DataFrame数据的索引也可以定制。

  In [35]: f3=DataFrame(data,columns=[name , marks , price],index=[a , b , c])

  在[36]: f3

  Out[36]:

  名称标志价格

  谷歌100 1

  百度200 2

  雅虎300 3

  除上述方法外,您还可以使用“逐个字典”的方法来定义DataFrame。

  in[40]:new data={ lang :{ first : python , second:java}, price:{first:5000, second:2000}}

  在[41]中:f4=DataFrame(newdata)

  在[42]: f4

  Out[42]:

  郎价格

  第一个python 5000

  第二个java 2000

  字典中指定了序列名(一级键)、每行的索引(二级字典键)和对应的数据(二级字典值),即字典中指定了每个数据网格中的数据,没有指定的都为空。

  DataFrame对象的Columns属性可以显示众所周知的列名。并且,你还可以使用下面类似字典的方式来获取一个垂直列的所有内容(当然包括索引):

  new data={ lang :{ first line : python , secondline:java}, price:{firstline:8000}}

  f4=数据帧(新数据)

  法乐四联症

  郎价格

  一线python 8000

  二线java NaN

  DataFrame(newdata,index=[firstline , secondline , thirdline])

  郎价格

  一线python 8000

  二线java NaN

  第三线楠楠

  DataFrame对象的Columns属性可以显示众所周知的列名。并且,你还可以使用下面类似字典的方式来获取一个垂直列的所有内容(当然包括索引):

  在[44]中:f3[名称]

  Out[44]:

  谷歌

  百度

  雅虎

  名称:名称,数据类型:对象

  下面的操作是将值赋给同一列。

  newdata1={username:{first :王兴, second :大雕 }, age:{first:24, second:25}}

  In [67]: f6=DataFrame(newdata1,columns=[username , age , sex])

  在[68]中:f6

  Out[68]:

  用户名年龄性别

  第一王兴24南

  第二大调25南

  在[69]: f6[性]=人

  在[70]中:f6

  Out[70]:

  用户名年龄性别

  第一个王兴24人

  第二大雕25人

  您也可以单独赋值。除了统一赋值外,还可以“点对点”添加值。结合前面的Series,由于DataFrame对象的每个垂直列都是一个Series对象,所以可以先定义一个Series对象,然后放入DataFrame对象中。如下所示:

  Ssex=系列([男性,女性],index=[第一,第二])

  In [72]: f6[sex]=ssex

  在[73]中:f6

  Out[73]:

  用户名年龄性别

  第一王兴24男

  第二大调25女

  还可以更精准的修改数据吗?当然可以,完全仿照字典的操作:

  在[74]中:f6[年龄][秒]=30

  在[75]中:f6

  Out[75]:

  用户名年龄性别

  第一王兴24男

  第二大调30女

  参考http://维基。吉克雪原。com/project/start-learning-python/312。超文本标记语言所整理。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: