如果数据集中存在缺失值,数据分析中对于数据缺失值的处理方法
我们需要转换不同类型的字段。在这个过程中,我们需要检查是否存在其他值。
以指示缺少的值。前面说过,我们只能验证None(Python原生对象)和。
Np。Nan(numpy/pandas是读取数据文件时文件内缺失对象的读取后表示)对象。但是除此之外,我们
还需要注意数据集是否包含表示缺失值的符号。如果R空间表示缺失值,第一步是离散字段的转换过程:
通过比较离散变量的值,我们发现不存在其他值代表缺失值的情况。
需要注意的是,如果是连续变量,上述方法不能用于检验(有很多值),而是因为经常是
我们需要把它转换成一个数值变量,然后进行分析。因此,对于连续变量,是否存在代表缺失值的其他值。
条件,我们也可以通过观察转换来区分,例如,如果缺失值是用空格来表示的,就不能直接用astype来
转换为数值类型
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。