pandas读取csv文件的某一列数据,python读取csv某一列

  pandas读取csv文件的某一列数据,python读取csv某一列

  熊猫读取的CSV文件的原始数据包含公司员工的数据。

  把格雷厄姆查普曼03/15/1450000.0010 johnclese 06/01/1565000.08 ericidle 05/12/14444500000 1448000.007麦克帕林05/23/1366000.008 CSV文件

  ImportPandasDF=pandas . read _ CSV(HR data . CSV)(print)df)就是这么简单。只有三行代码,其中只有一行真正有用。Pandas.read_CSV))打开、分析、读取提供的CSV文件并将数据保存到DataFrame。打印数据帧时,您将得到以下输出:

  值得注意的要点如下。

  首先,pandas会识别CSV的第一行包含列名,并自动使用它。

  但是,pandas也在DataFrame中使用从零开始的整数索引。那是因为我没有告诉你我们的索引应该是什么。

  此外,根据列的数据类型,pandas已经正确地将Salary和病假天数中剩余的列转换为数字,但是雇佣日期列仍然是字符串。这在交互模式下很容易确认。

  让我们马上解决这些问题。要使用另一列作为DataFrame的索引,请添加index_col可选参数。

  2=pandas.read _ csv (hrdata.csv),index_col=Name) (print) df2)现在Name字段就是我们的数据框索引。

  接下来,修改“雇佣日期”字段的数据类型。可选的parse_dates参数允许pandas强制将数据作为日期读取。该参数被定义为要作为日期处理的列名列表。

  关注DF3=pandas.read_CSV(HRdata。CSV),index_col=Name),parse_dates=[雇佣日期] (print) df3)输出。

  日期格式正确,可以在交互模式下轻松确认。

  如果CSV文件的第一行没有列名,可以使用可选的names参数指定列名列表。您也可以使用此选项来覆盖第一行中指定的列名。在这种情况下,必须使用可选参数header=0来指示pandas.read_csv))忽略现有的列名。

  DF4=pandas.read_CSV(HRdata。CSV),index_col=Employee ,parse_dates=[Hired],header=0,Nader这将提供以下输出:

  2.用熊猫写CSV文件。当然,如果不能从Panda输出数据,Panda可能用处不大。将数据帧写入CSV文件就像导入文件一样简单。将新列名的数据写入新的CSV文件。

  DF5=pandas.read_CSV(HRdata。CSV),index_col=Employee ,parse _ dates=[ Employee ],header=0。纳德的新CSV文件如下:

  参考这篇文章。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: