我有一个数据框,df并且从中使用了几列groupby:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()
通过以上方法,我几乎得到了所需的表(数据框)。缺少的是另外一列,其中包含每个组中的行数。换句话说,我有意思,但我也想知道有多少个数字被用来获得这些价值。例如,在第一组中有8个值,在第二组中有10个,依此类推。
简而言之:如何获取数据框的分组统计信息?
在·对象上,该·函数可以列出一个列表,以一次应用多种聚合方法。这应该给你需要的结果:
df[['col1', 'col2', 'col3', 'col4']].groupby(['col1', 'col2']).agg(['mean', 'count'])