python删除excel中的空白行,python pandas 去空格
我有一个像这样的Excel文件
名称位置日期检查_1检查_2开盘高/低/收盘
0橙色纽约20200501 V V 5.5 5.85 5.45 5.7
1苹果明斯克20200504 V X南南南南
2牛排达拉斯20200506 V X楠楠楠楠
“NaN”栏应填入数据,数据位于panda数据框中,如下所示:
名称位置日期检查_2开盘高/低/收盘
一份达拉斯牛排20200506 X 8.4 8.8 8.37 8.80
0苹果明斯克20200504 X 3.7 3.75 3.35 3.57
如何附加一个只有NaN列填充的excel文件,并且整个文件不会只被数据框中的数据覆盖?是应该为整个excel文件创建一个新的数据框并写入,还是有更简单的方法?而我该怎么办?
编辑:所需输出:
名称位置日期检查_1检查_2开盘高/低/收盘
0橙色纽约20200501 V V 5.5 5.85 5.45 5.7
1苹果明斯克20200504 V V 3.7 3.75 3.35 3.57
2牛排达拉斯20200506 V V 8.4 8.8 8.37 8.8
参考方案
首先,您需要指定DataFrame使用哪些列来匹配两个DataFrame.set_index中的行,然后使用DataFrame.combine_first只替换缺少的值。df1的最后一个更改顺序由df1.columns的列和原始设置顺序使用,以便按帮助器列排序:
df1[count]=np.arange(len(df1))
df11=df1.set_index([名称,位置,日期])
df22=df2.set_index([名称,位置,日期])
df=df22.combine_first(df11)。reset_index()。reindex(df1.columns,axis=1)。排序值(计数)
打印(df)
名称位置日期Check_1 Check_2开盘价上限下限收盘计数
1橙色纽约20200501 V V 5.5 5.85 5.45 5.70 0.0
0苹果明斯克20200504 V X 3.7 3.75 3.35 3.57 1.0
2达拉斯牛排20200506 V X 8.4 8.80 8.37 8.80 2.0
Python熊猫:按组分组,平均?-蟒蛇
我有一个数据框是这样的:集群组织时间1a 81 a62 h 341 c 232d 743 w 6我想计算每个集群中每个组织的平均时间。预期结果:cluster mean(time)1 15((8 6)/2 23)/2 2 54(74 34)/2 3 6我不知道在panda里是怎么做的。有人能帮我吗?参考…python:安装python后如何导入Panda-python?
我已经安装了python。现在,当我尝试运行import pandas as pd时,我得到以下错误回溯(最近一次调用是最后一次):文件,第1行,在import pandas文件中导入错误:… Python pandas:在多个列上构建布尔索引-python
尽管在Python的pandas库中至少有两本关于如何索引DataFrame的好教程,但我仍然找不到一个关于多列的优雅的SELECT编码方法。D=pd.dataframe ({x: [1,2,3,4,5], y: [4,5,6,7,8]}) GT … Python熊猫:选择索引范围-python
数据=[RAC1 , CD0287 ,1.52],[RAC1 , CD0695 ,2.08],[ RAC1 , ADN103-1 ,2.01],[RAC3 , CD0258]
我有一个if语句,它检查数据框是否为空。我的操作方式如下:if dataframe . empty:pass else:# dosomething但实际上我需要:if data frame不为空:# do something我的问题是——有没有一个. not_empty()方法可以达到这个目的?我还想问一下第二个版本在性能方面是不是更好…
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。