根据其他列值从panda数据框中删除重复项

一尘不染

根据其他列值从panda数据框中删除重复项

我正在使用的数据框如下：

Name    NoOfTrans   Avg_pass_time    Cons.Error            RunCounts
Jan     0                            Failed:abcd           4
Jan                                                        4
Jan                                                        4
Jan                                                        4
May     2                            Failed:abcFailed:cde  5
May                                                        5
May                  1200                                  5
May                  1200                                  5
May                                                        5

我需要按“名称”列从“名称”、“Avg_pass_time”和“RunCounts”列组中删除重复项，以便输出如下：

Name    NoOfTrans   Avg_pass_time    Cons.Error            RunCounts
Jan     0                            Failed:abcd           4
May     2           1200             Failed:abcFailed:cde  5

任何指南都会很有用

阅读 243

2022-09-30

共1个答案

一尘不染

如果每个组只是空字符串或重复值，请使用：

df = df.replace('',np.nan).groupby('Name', as_index=False).first().fillna('')

2022-09-30