Python数据分析可视化,python数据处理及可视化

  Python数据分析可视化,python数据处理及可视化

  目录数据的离散化和类型

  数据离散化和类型

  数据操作的逻辑分层,即所谓的离散化,是无限空间中的有限个体到有限空间的映射。数据离散化主要是对连续数据进行的。经过处理后,数据值的范围分布将由连续属性变为离散属性。该属性通常包含两个或多个值范围。

  离散化的必要性

  节省计算资源,提高计算效率。算法模型(尤其是分类模型)的计算要求。虽然决策树等很多模型都可以支持连续数据的输入,但是决策树本身会先把连续数据转换成离散数据,所以离散转换是必不可少的一步。增强模型的稳定性和准确性。数据离散化后,异常数据不会明显突出异常特征,而是被划分为一个子集。时间数据离散化

  离散时间。通常,时间戳会转换为秒、分、小时或上午和下午。通常,日期被转换成周数、星期几、月份、工作日或休息日、季度、年份等等。

  数据离散化可以将细粒度的时间序列数据离散成三种粗粒度的数据:

  离散成分类数据,如上午和下午;离散成连续数据,如周一、周二、周三;离散化是数字数据。比如一年有52周,周数就是数值数据。进口熊猫

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: