python数据分析 活用pandas,python数据处理pandas

  python数据分析 活用pandas,python数据处理pandas

  本文将通过阅读一个股票数据来介绍熊猫的一些基本数据操作。文章中的示例代码有详细的讲解,感兴趣的朋友可以跟边肖一起学习。

  00-1010 1索引操作1.1直接使用行列索引(先列后行)1.2使用索引结合loc或iloc 1.3使用ix组合索引2赋值操作3排序3.1数据帧排序3.2序列排序为了更好地理解这些基本操作,下面通过阅读一个股票数据来介绍熊猫基本数据操作的语法。

  #读取文件(读取并保存文件后,会具体说明。这里直接调用api)

  Data=pd.read _ csv(。/data/stock _ day.csv) #读取当前目录下的下一个csv文件

  #删除一些列以使数据更简单,然后执行以下操作。

  data=data.drop([ma5 , ma10 , ma20 , v_ma5 , v_ma10 , v_ma20],axis=1)

  

目录

  在Numpy中,我们已经讨论过使用索引来选择序列和切片。熊猫也支持类似的操作。您也可以直接使用列名、行名,甚至是它们的组合。

  

1 索引操作

  例:得到2018年2月27日的收盘价,即得到2018年2月27日“‘收盘’”的结果。

  #直接使用行名和列名索引的方式(先列后行)

  数据[关闭][2018-02-27]

  24.16

  #不支持的操作

  #错误

  数据[2018-02-27][关闭]

  #错误

  数据[:1,2]

  

1.1 直接使用行列索引(先列后行)

  从 2018-02-27 : 2018-02-22 ,关闭获取结果

  #使用loc:只能指定行和列索引的名称。

  data . loc[ 2018-02-25 : 2018-02-14 , open: 低]

  #使用iloc,可以通过索引下标得到。

  #获取前3天的数据,前5列的结果

  data.iloc[:3,5]

  高开低走

  2018-02-27 23.53 25.88 24.16 23.53

  2018-02-26 22.80 23.78 23.53 22.80

  2018-02-23 22.88 23.37 22.82 22.71

  

1.2 结合loc或者iloc使用索引

  从线的第1天到第4天,获取四个指标[开、关、高和低]的结果。

  #使用ix引用下表和名称组合。

  data.ix[0:4,[打开,关闭,高,低]]

  #使用loc和iloc获得它的推荐方法

  data.loc[data.index[0:4],[打开,关闭,高,低]]

  data.iloc[0:4,data . columns . get _ indexer([ open , close , high , low])]

  开盘收盘高/低

  2018-02-27 23.53 24.16 25.88 23.53

  2018-02-26 22.80 23.53 23.78 22.80

  2018-02-23 22.88 22.82 23.37 22.71

  2018-02-22 22.25 22.28 22.76 22.02

  

1.3 使用ix组合索引

  将数据框中的收盘列重新赋值为1。

  #直接修改原始值

  数据[关闭]=1

  #或者

  data.close=1

  

2 赋值操作

  排序有两种形式,一种是索引排序,一种是内容排序。

  

3 排序

  使用df.sort_values(by=,ascending=)

  单键或多键,

  参数:

  1.by:指定排序引用的键。

  2 .升序:默认升序

  升序=False:降序升序=True:升序#按开盘价排序,用升序指定按大小排序,取前五行数据。

  data.sort_values(by=open ,ascending=True)。头部()

  #按多个关键字排序

  data.sort_values(by=[open , high])

  使用df.sort_index对索引进行排序。

  股票的日期指数以前是从小到大,现在是从小到大重新排序。

  #对索引排序

  data.sort _索引()

  

3.1 DataFrame排序

  使用series . sort _ values(ascending=true)进行排序。

  对数列排序时,只有一列,不需要参数。

  数据[p_change]。sort_values(升序=True)。头部()

  2015-09-01 -10.03

  2015-09-14 -10.02

  2016-01-11 -10.02

  2015-07-15 -10.02

  2015-08-26 -10.01

  Name: p_change,dtype: float64

  使用series.sort_index()进行排序,与Dataframe方法一致。

  #对索引排序

  数据[p_change]。sort_index()。头部()

  2015-03-02 2.62

  2015-03-03 1.44

  2015-03-04 1.57

  2015-03-05 2.02

  2015-03-06 8.51

  Name: p_change,dtype: float64

  关于Python熊猫学习的基础数据操作详解这篇文章到此为止。关于Python熊猫数据操作的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • 2020年高考成绩分布表,2020年高考成绩统计,数据分析2020年全国各省高考成绩分布情况
  • ,,python实现数据分析与建模
  • python3 数据分析,python数据分析课堂
  • 《数据思维》,数据分析的思维导图
  • python数据分析就业方向,python数据分析毕业论文
  • python数据分析数据清洗,python中数据清洗
  • 基于Python的数据可视化,python数据分析及可视化处理的第三方库
  • 利用python进行数据分析豆瓣,python数据分析基础和利用python进行数据分析
  • python数据分析数据清洗,用python进行数据清洗
  • python对excel表格数据的统计和分析,python进行excel数据分析
  • 从零开始学Python数据分析与挖掘,自学python数据分析
  • python数据分析结构思维导图,python组合数据类型思维导图
  • 关联规则分析案例,关联规则数据分析题,关联规则的实际案例数据
  • 数据分析与商业数据分析,120个Excel商业数据分析实战案例
  • python数据分析excel读写,python 读取excel数据
  • 留言与评论(共有 条评论)
       
    验证码: