pandas 类型转换,pandas数据格式转换
摘要:本文主要介绍了python数据处理中Pandas类型转换的实现,并通过实例代码进行了详细介绍,具有一定的参考价值。感兴趣的朋友可以参考一下。
00-1010转换为字符串类型、转换为数值类型和转换为数值类型。还可以使用to_numeric()函数对数据进行分类(类别)数据类型汇总。
目录
tips[sex_str]=tips[sex]。astype(字符串)
转换为字符串类型
转换为数值类型
DataFrame的每一列的数据类型必须相同。当某些数据丢失,但不是NaN(如missing、null等。),整列数据会变成字符串类型而不是数值类型。这时,可以使用to_numeric进行处理。
#创建以“缺失”为缺失值的数据
tips_sub_miss=tips.head(10)
tips_sub_miss.loc[[1,3,5,7], total_bill]=missing
tips_sub_miss
自动转换为了字符串类型:
使用astype转换报错:
tips_sub_miss[total_bill]。astype(浮点型)
使用to_numeric()函数:
如果直接使用to_numeric()函数,仍然会得到一个错误。添加错误参数。
错误变量参数:
忽略遇到错误。跳过(只是跳过未转换的类型)强制遇到未转换的值,并将其强制转换为nanpd . to _ numeric(tips _ sub _ miss[ total _ bill ],errors= ignore )
PD . to _ numeric(tips _ sub _ miss[ total _ bill ],errors= constrate )
to_numeric向下转型:
向下转换参数
整数和有符号最小有符号整数数据类型浮点最小浮点数据类型无符号最小无符号整数数据类型downcast参数设置为float之后, total_bill的数据类型由float64变为float32
PD . to _ numeric(tips _ sub _ miss[ total _ bill ],errors= constrate ,downcast=float )
转为数值类型还可以使用to_numeric()函数
使用pd。categorial()来创建分类数据。Categorical()通常有三个参数。
1值,如果values中的值不在categories参数中,则对于2个类别,它将被NaN替换。指定可能的类别数据,并参考3订购。是否指定顺序s=pd.series (pd.category ([a , b , c , d],categories=[c
分类数据排序会自动根据分类排序:
ordered指定顺序:
从pandas.api.types导入CategoricalDtype
#创建一个分类排序来指定顺序
cat=CategoricalDtype(categories=[ B , D , A , C],ordered=True)
#将series_cat1转换类型指定为创建的分类类型。
series _ cat 1=series _ cat . as type(cat)
print(series_cat.sort_values())
print(series_cat1.sort_values())
分类数据(Category)
知识点Numpy 1的特点。Numpy是一个高效的科学计算库,熊猫的数据计算功能就是Numpy的封装。
2.ndarray是Numpy的基础数据结构,熊猫的Series和DataFrame的很多功能和属性都和ndarray一样。
3.Numpy的计算效率远高于原生Python,支持并行计算熊猫数据类型转换。1.除了数字int和float类型,Panda还有object、category、bool、datetime类型。
2.数据类型转换可以由as_type和to_numeric函数执行。熊猫分类数据类型1。类别类型,可用于排序,排序顺序可自定义。
2.CategoricalDtype可用于定义顺序。本文介绍了python数据处理中panda类型转换的实现。关于熊猫类型转换的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。