一尘不染

Python-使用pandas GroupBy获取每个组的统计信息(例如计数,均值等)?

python

我有一个数据框,df并且从中使用了几列groupby:

df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()

通过以上方法,我几乎得到了所需的表(数据框)。缺少的是另外一列,其中包含每个组中的行数。换句话说,我有意思,但我也想知道有多少个数字被用来获得这些价值。例如,在第一组中有8个值,在第二组中有10个,依此类推。

简而言之:如何获取数据框的分组统计信息?


阅读 1474

收藏
2020-02-08

共1个答案

一尘不染

在·对象上,该·函数可以列出一个列表,以一次应用多种聚合方法。这应该给你需要的结果:

df[['col1', 'col2', 'col3', 'col4']].groupby(['col1', 'col2']).agg(['mean', 'count'])
2020-02-08