python 时间序列分析库,python序列数据类型
因为TimeSeries是Series的子类,所以在数据选择上和Series是一样的。
创建一个时间序列ts例如:
从pandas导入系列从numpy导入随机数从datetime导入datetime导入numpy作为NP导入pandas作为pddates=[datetime(2011,1,2),datetime(2011年1月5日),Datetime(2011年1月7日),Datetime(2011年1月8日),Datetime(2011年1月9日)] ts=系列(NP。随意
in:stamp=ts . index[2]print(ts[stamp])print(ts[ts . index[2]])print(ts[2])2。传入一个可以解释为日期的字符串。
in:print(ts[ 2011 01 02 ])print(ts[ 1/2/2011 ])print(ts[ 2011-01-02 ])如果我们使用的是长时间序列,可能需要取某一段时间的数据,所以需要为时间序列选择某一段时间。
首先,创建一个长时间序列longer_tp例如:
in:longer _ TP=series(NP . random . randn(1000),index=pd.date _ range (1/1/2011 ,period=1000)) print (longer _ TP) 1 .选择“年”或“年和月”的数据切片
in:print(Longer _ TP[ 2011 ])print(Longer _ TP[ 2011-05 ])2 .选择特定日期后的数据切片。
in:print(Longer _ TP[DateTime(2011年1月,2月):]) 3 .选择特定时间段的数据切片,或者使用时间序列中不存在的时间戳对其进行切片。输入的日期可以是日期时间、时间戳或字符串日期。
in:print(Longer _ TP[datetime(2011,1,2):datetime(2011,2,2)])print(Longer _ TP[datetime(2010,12,1):datetime(2011,1,10)])print(Longer _ TP[ 2011-01-01 00:00: 2011-02-01 00:00 ])print(Longer _ TP[ 2011 01 01: 201
In: print (Longer _ TP。Truncate (after= 1/9/2011 ))在某些应用场景下,可能会出现一个时间点有多个观测值的情况。这时候我们按时间点选取数据,那个时间点有几个观测值,就会输出几个观测值。
创建重复的时间序列dup_ts例如:
In:dates=pd。DatetimeIndex([1/1/2011 , 1/2/2011 , 1/2/2011 , 1/2/2011 , 1/3/2011 ])dup _ ts=Series(NP . randn(5),Index=dates) print(dup_ts)可以通过使用检查索引的is_unique属性来检查时间序列是否唯一。如果唯一,则输出True,如果不唯一,则输出False。
in:print(dup _ ts . index . is _ unique)1。选择不重复的时间点。
in:print(dup _ ts[日期时间(2011年1月,3月)] 2。选择重复的时间点。
In:print(dup_ts[datetime(2011,1,2)])
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。