我正在使用的数据框如下:
Name NoOfTrans Avg_pass_time Cons.Error RunCounts
Jan 0 Failed:abcd 4
Jan 4
Jan 4
Jan 4
May 2 Failed:abcFailed:cde 5
May 5
May 1200 5
May 1200 5
May 5
我需要按“名称”列从“名称”、“Avg_pass_time”和“RunCounts”列组中删除重复项,以便输出如下:
Name NoOfTrans Avg_pass_time Cons.Error RunCounts
Jan 0 Failed:abcd 4
May 2 1200 Failed:abcFailed:cde 5
任何指南都会很有用
如果每个组只是空字符串或重复值,请使用:
df = df.replace('',np.nan).groupby('Name', as_index=False).first().fillna('')