我正在使用的数据框如下:
Name NoOfTrans Avg_pass_time Cons.Error RunCounts Jan 0 Failed:abcd 4 Jan 4 Jan 4 Jan 4 May 2 Failed:abcFailed:cde 5 May 5 May 1200 5 May 1200 5 May 5
我需要按“名称”列从“名称”、“Avg_pass_time”和“RunCounts”列组中删除重复项,以便输出如下:
Name NoOfTrans Avg_pass_time Cons.Error RunCounts Jan 0 Failed:abcd 4 May 2 1200 Failed:abcFailed:cde 5
任何指南都会很有用
如果每个组只是空字符串或重复值,请使用:
df = df.replace('',np.nan).groupby('Name', as_index=False).first().fillna('')