python时序数据分析与预测,python时间序列模型

  python时序数据分析与预测,python时间序列模型

  预测给定输入序列中的下一个输入序列是机器学习中的另一个重要概念。本章为您提供分析时间序列数据的详细说明。有需要的朋友可以参考一下,希望能有所帮助。

  00-1010序列分析或时间序列分析的基本概念介绍。安装实用软件包PandashmmLearnPyStructCxOptBandas 3360,切片从时间序列数据中提取统计数据。处理时序数据切片时序数据的例子。从时间序列数据中提取统计数据。最大值和最小值。所有内容一次被重新采样。通过隐马尔可夫分析序列数据模型(HMM)获得具有mean()滚动平均值的重采样。隐马尔可夫模型(HMM)状态(s)输出符号(o)状态转移概率矩阵(a)观测传输概率矩阵(b

  

目录

  时间序列数据表示一系列特定时间的数据间隔。如果要在机器学习中构造序列预测,那么就必须处理序列数据和时间。系列数据是序列数据的汇总。数据排序是序列数据的一个重要特征。

  

简介

  序列分析或时间序列分析是基于以前的观测值,在给定的输入序列中预测下一个。预测可以是接下来可能发生的任何事情3360个符号、数字、第二天的天气、下一个声音等等。序列分析在股市分析、天气预报、产品推荐等应用中非常方便。

  例子

  请考虑下面的例子来理解序列预测。在这里,A,B,C和D是给定值,您必须使用序列预测模型来预测值e .

  

序列分析或时间序列分析的基本概念

  使用Python进行时间序列数据分析,需要安装以下软件包:

  

安装实用软件包

  Pandas是一个开源的BSD许可证库,它提供了高性能、易于使用的数据结构和Python数据分析工具。您可以使用以下命令安装Pandas3360

  pip安装熊猫

  如果您正在使用Anaconda,并且想要使用conda包管理器进行安装,那么您可以使用下面的命令3360。

  康达安装-c蟒蛇熊猫

  

Pandas

  这是一个开源的BSD许可的库,由Python中学习隐马尔可夫模型(HMM)的简单算法和模型组成。您可以借助以下命令安装3360

  pip安装hmmlearn

  如果您正在使用Anaconda,并且想要使用conda包管理器进行安装,那么您可以使用下面的命令3360。

  康达安装-全媒体hmmlearn

  

hmmlearn

  这是一个结构化的学习和预测库。在PyStruct中实现的学习算法有条件随机场(CRF)、最大边马尔可夫随机网络(M3N)或结构支持向量机等名称。你可以

  借助以下命令安装它 :

  

pip install pystruct

  

  

CVXOPT

  它用于基于Python编程语言的凸优化.它也是一个免费的软件包.您可以使用以下命令和减号安装它;

  

pip install cvxopt

  如果您使用的是Anaconda并希望使用conda软件包管理器进行安装,那么您可以使用以下命令 :

  

conda install -c anaconda cvdoxt

  

  

Pandas:处理,切片和从时间序列数据中提取统计数据

  如果您必须使用时间序列数据,Pandas是一个非常有用的工具.在Pandas的帮助下,您可以执行以下 :

  

  • 使用创建一系列日期pd.date_rangepackage
  • 使用pd.Series包索引带有日期的pandas
  • 使用ts.resample包进行重新采样
  • 更改频率

  

  

示例

  以下示例显示您使用以下方式处理和切片时间序列数据大熊猫.请注意,这里我们使用的是每月北极涛动数据,可以从 monthly.ao.index.b50.current.ascii ,可以转换为文本格式供我们使用.

  

  

处理时间序列数据

  对于处理时间序列数据,您必须执行以下步骤 :

  第一步涉及导入以下包 :

  

import numpy as np

  import matplotlib.pyplot as plt

  import pandas as pd

  接下来,定义一个函数,它将从输入文件中读取数据,如下面给出的代码所示 :

  

def read_data(input_file):

  input_data = np.loadtxt(input_file, delimiter = None)

  现在,将此数据转换为时间序列.为此,请创建我们时间序列的日期范围.在这个例子中,我们保留一个月的数据频率.我们的文件的数据从1950年1月开始.

  

dates = pd.date_range(1950-01, periods = input_data.shape[0], freq = M)

  在这一步中,我们在Pandas系列的帮助下创建时间序列数据,如下图所示 :

  

output = pd.Series(input_data[:, index], index = dates)	

  return output

  if __name__==__main__:

  输入输入文件的路径,如下所示 :

  

input_file = "/Users/admin/AO.txt"

  现在,将列转换为时间序列格式,如下所示 :

  

timeseries = read_data(input_file)

  最后,使用显示和减去的命令绘制和可视化数据;

  

plt.figure()

  timeseries.plot()

  plt.show()

  您将观察到如下图所示的图形 :

  

  

  

  

切片时间序列数据

  切片只涉及检索时间序列数据的某些部分.作为示例的一部分,我们仅从1980年到1990年对数据进行切片.观察执行此任务的以下代码 :

  

timeseries[1980:1990].plot()

    <matplotlib.axes._subplots.AxesSubplot at 0xa0e4b00>

  plt.show()

  当您运行切片时间序列数据的代码时,您可以将以下图表视为图中显示的是 :

  

  

  

提取来自时间序列数据的统计数据

  如果需要得出一些重要结论,则必须从给定数据中提取一些统计数据.平均值,方差,相关性,最大值和最小值是一些此类统计数据.如果要从给定的时间序列数据中提取此类统计数据,可以使用以下代码;

  

  

平均值

  您可以使用mean()函数,用于查找均值,如此处所示 :

  

timeseries.mean()

  然后,您将针对所讨论的示例观察到的输出是 :

  

-0.11143128165238671

  

  

  

最大值

  您可以使用max()功能查找最大值,如下所示 :

  

timeseries.max()

  然后,您将针对所讨论的示例观察到的输出是 :

  

3.4952999999999999

  

  

  

最小值

  您可以使用min()函数查找最小值,如下所示 :

  

timeseries.min()

  然后,您将针对所讨论的示例观察到的输出是 :

  

-4.2656999999999998

  

  

  

一次性获取所有内容

  如果您想一次计算所有统计数据,可以使用describe()函数,如下所示 :

  

timeseries.describe()

  然后,您将针对所讨论的示例观察到的输出是 :

  

count 817.000000
mean -0.111431
std 1.003151
min -4.265700
25% -0.649430
50% -0.042744
75% 0.475720
max 3.495300
dtype: float64

  

  

  

重新采样

  您可以将数据重新采样到不同的时间频率.执行重新采样的两个参数是 :

  时间段

  方法

  

  

使用mean()重新采样

  您可以使用以下代码使用mean()重新采样数据方法,这是默认方法 :

  

timeseries_mm = timeseries.resample("A").mean()

  timeseries_mm.plot(style = g--)

  plt.show()

  然后,您可以观察以下图表作为重采样的输出使用mean() :

  

  

  

Re -sampling with median()

  您可以使用以下代码使用median()方法重新取样数据 :

  

timeseries_mm = timeseries.resample("A").median()

  timeseries_mm.plot()

  plt.show()

  然后,您可以观察下图作为重新采样的输出,其中位数为() :

  

  

  

滚动平均值

  您可以使用以下代码计算滚动(移动)均值和减去;

  

timeseries.rolling(window = 12, center = False).mean().plot(style = -g)

  plt.show()

  然后,您可以观察下图作为滚动的输出(移动)mean :

  

  

  

通过隐马尔可夫分析顺序数据模型(HMM)

  HMM是一种统计模型,广泛用于具有延续性和可扩展性的数据,如时间序列股票市场分析,健康检查和语音反馈gnition.本节详细介绍了使用隐马尔可夫模型(HMM)分析顺序数据.

  

  

隐马尔可夫模型(HMM)

  HMM是一个随机模型这是建立在马尔可夫链概念的基础上的,该假设未来统计数据的概率仅取决于当前的过程状态而不是之前的任何状态.例如,当掷硬币时,我们不能说第五次抛掷的结果将是一个头.这是因为硬币没有任何记忆,下一个结果不依赖于之前的结果.

  数学上,HMM由以下变量和减号组成;

  

  

状态(S)

  它是HMM中存在的一组隐藏或潜在状态.它由S表示.

  

  

输出符号(O)

  它是HMM中存在的一组可能的输出符号.它由O表示.

  

  

状态转换概率矩阵(A)

  它是从一个状态转换到另一个状态的概率状态.它由A表示.

  

  

观察发射概率矩阵(B)

  它是在特定状态下发射/观察符号的概率.它用B表示.

  

  

先验概率矩阵(Π)

  它是从系统的各种状态开始于特定状态的概率.它由Π表示.

  因此,HMM可以定义为λ=(S,O,A,B,π),

  其中,

  S = {s1,s2,...,sN}是一组N个可能的状态,

  O = {o1,o2,...,oM}是一组M个可能的观察符号,

  A是N

  以上就是Python与AI分析时间序列数据的详细内容,更多关于Python AI分析时间序列的资料请关注盛行IT软件开发工作室其它相关文章!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • ,,Python中利用LSTM模型进行时间序列预测分析的实现
  • 时间序列adf检验怎么判断平稳性,
  • python时间序列模型,python时间序列预测代码
  • 用python实现ARIMA时间序列预测实例,python时间序列预测的方法
  • python时间序列分析模块,用python实现ARIMA时间序列预测实例
  • 时间序列模型用于哪种预测,时间序列预测模型实验报告
  • 时间序列分析难不难,时间序列分析问题
  • python最简单的时间序列预测,python 时间序列模型
  • 基于lstm的时间序列预测,基于cnn的时间序列预测模型
  • Eviews时间序列模型,时间序列回归模型步骤
  • 时间序列分析基于r期末考试,时间序列分析选择题
  • 时间序列预测的基本前提,简述常用的几种时间序列预测方法
  • 时间序列的多元线性回归模型,时间序列的经典线性回归模型的基本假定是什么
  • adf检验 python,如果时间序列zt经过adf检验
  • stata时间序列数据处理,时间序列数据怎么用stata做回归分析
  • 留言与评论(共有 条评论)
       
    验证码: