pandas读取excel文件,pandas什么意思
文章目录代码结果:
代码# -*-编码:utf-8 -*-
# 对数据进行基本的探索
# 返回缺失值个数以及最大最小值
从安装导入工作簿
从openpyxl.utils.dataframe导入数据帧到行
进口熊猫作为螺纹中径
前缀=。/exp5/
datafile=air_data.csv #航空原始数据,第一行为属性标签
结果文件= explore _ result。xls #数据探索结果表
# 读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)
data_table=pd.read_csv(前缀数据文件,编码=utf-8 )
#打印(数据表格)
""返回
数据帧或文本解析器
逗号分隔值(csv)文件作为带有标记轴的二维数据结构返回。
df _ described=data _ table。描述(百分点=[
0.75],include=all )
#打印(df _ described)
# 包括对数据的基本描述,百分点参数是指定计算多少的分位数表(如1/4分位数、(1/2分位数)中位数等);T是转置,转置后更方便查阅;包括:要显示的数据类型对应的数据列
df _ described _ T=df _ described .T
打印(df_described_T)
数据帧。计数
计算非不适用/无效观察值的数量。
DataFrame.max
对象中的最大值。
DataFrame.min
对象中的最小值。
数据帧。平均值
数值的平均值。
DataFrame.std
观察值的标准偏差。
DataFrame.select_dtypes
数据帧的子集,包括/不包括基于其数据类型的列。
# print(len(data_table))
# print(len(data_table))
# print(df_described[count])
# print(df_described_T[count])
# print(len(data _ table)-df _ described _ T[ count ])
#描述()函数自动计算非空值数,空值数需自己动手计算;df_described[null]将为df _描述增加一列空列
df _ described _ T[ null ]=len(data _ table)-df _ described _ T[ count ]
df_described_T[标准差]=data_table.std()
打印(df_described_T)
获取指定的列:(使用包含列名的列表)
df _ described _ 5=df _ described _ T[[ null , max , min , mean , std]]
# print(df_described_T)
# 表头重命名
df_described_5.columns=[u 空值数,u 最大值,u 最小值,u 均值,u 标准差]
这里只选取部分探索结果。
描述()函数自动计算的字df=pd .数据帧({ 分类:pd .分类([d , e , f]),
数字:[1,2,3],
对象:[a , b , c]
})段有计数(非空值数)、独特(唯一值数)、top(频数最高者)、freq(最高频数)、均值(平均值)、std(标准差)、分钟(最小值)、50%(中位数)、max(最大值)
# explore_table.to_excel(前缀结果文件)#导出结果
wb=工作簿()
ws=wb.active
#将数据帧中的条目写入超过表格
对于数据帧到行中的r(df _ described _ 5,index=True,header=True):
ws.append(r)
wb.save(前缀结果文件)
结果:
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。