我有一个这样的数据框说
>>> df = pd.DataFrame({'user_id':['a','a','s','s','s'], 'session':[4,5,4,5,5], 'revenue':[-1,0,1,2,1]}) >>> df revenue session user_id 0 -1 4 a 1 0 5 a 2 1 4 s 3 2 5 s 4 1 5 s
和会话和收入的每个值代表了一种类型的,我要统计每个种类的数量表示的数量revenue=-1和session=4的user_id=a为1。
revenue=-1
session=4
user_id=a
count()在groupby()无法输出所需结果后,我发现简单的调用函数。
count()
groupby()
>>> df.groupby('user_id').count() revenue session user_id a 2 2 s 3 3
我怎样才能做到这一点?
您似乎想一次按几列分组:
df.groupby(['revenue','session','user_id'])['user_id'].count()
应该给你你想要的