pandas读取excel文件,pandas什么意思

  pandas读取excel文件,pandas什么意思

  文章目录代码结果:

  代码# -*-编码:utf-8 -*-

  # 对数据进行基本的探索

  # 返回缺失值个数以及最大最小值

  从安装导入工作簿

  从openpyxl.utils.dataframe导入数据帧到行

  进口熊猫作为螺纹中径

  前缀=。/exp5/

  datafile=air_data.csv #航空原始数据,第一行为属性标签

  结果文件= explore _ result。xls #数据探索结果表

  # 读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)

  data_table=pd.read_csv(前缀数据文件,编码=utf-8 )

  #打印(数据表格)

  ""返回

  数据帧或文本解析器

  逗号分隔值(csv)文件作为带有标记轴的二维数据结构返回。

  df _ described=data _ table。描述(百分点=[

  0.75],include=all )

  #打印(df _ described)

  # 包括对数据的基本描述,百分点参数是指定计算多少的分位数表(如1/4分位数、(1/2分位数)中位数等);T是转置,转置后更方便查阅;包括:要显示的数据类型对应的数据列

  df _ described _ T=df _ described .T

  打印(df_described_T)

  数据帧。计数

  计算非不适用/无效观察值的数量。

  DataFrame.max

  对象中的最大值。

  DataFrame.min

  对象中的最小值。

  数据帧。平均值

  数值的平均值。

  DataFrame.std

  观察值的标准偏差。

  DataFrame.select_dtypes

  数据帧的子集,包括/不包括基于其数据类型的列。

  # print(len(data_table))

  # print(len(data_table))

  # print(df_described[count])

  # print(df_described_T[count])

  # print(len(data _ table)-df _ described _ T[ count ])

  #描述()函数自动计算非空值数,空值数需自己动手计算;df_described[null]将为df _描述增加一列空列

  df _ described _ T[ null ]=len(data _ table)-df _ described _ T[ count ]

  df_described_T[标准差]=data_table.std()

  打印(df_described_T)

  获取指定的列:(使用包含列名的列表)

  df _ described _ 5=df _ described _ T[[ null , max , min , mean , std]]

  # print(df_described_T)

  # 表头重命名

  df_described_5.columns=[u 空值数,u 最大值,u 最小值,u 均值,u 标准差]

  这里只选取部分探索结果。

  描述()函数自动计算的字df=pd .数据帧({ 分类:pd .分类([d , e , f]),

  数字:[1,2,3],

  对象:[a , b , c]

  })段有计数(非空值数)、独特(唯一值数)、top(频数最高者)、freq(最高频数)、均值(平均值)、std(标准差)、分钟(最小值)、50%(中位数)、max(最大值)

  # explore_table.to_excel(前缀结果文件)#导出结果

  wb=工作簿()

  ws=wb.active

  #将数据帧中的条目写入超过表格

  对于数据帧到行中的r(df _ described _ 5,index=True,header=True):

  ws.append(r)

  wb.save(前缀结果文件)

  结果:

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: