小能豆

在 Pandas 交叉表中对索引进行分组

python

在 Pandas 交叉表中对索引进行分组


阅读 85

收藏
2023-05-22

共1个答案

小能豆

在Pandas中,可以使用交叉表(crosstab)函数对索引进行分组。交叉表是一种用于计算分组频率的特殊数据透视表。

下面是一个示例,演示如何使用交叉表对索引进行分组:

import pandas as pd

# 创建一个示例数据集
data = {
    'Gender': ['Male', 'Male', 'Female', 'Female', 'Male', 'Female'],
    'Age': ['Young', 'Young', 'Adult', 'Adult', 'Adult', 'Young'],
    'Smoker': ['No', 'Yes', 'Yes', 'No', 'Yes', 'No'],
    'Count': [10, 20, 15, 5, 8, 12]
}

df = pd.DataFrame(data)

# 使用交叉表对索引进行分组
cross_table = pd.crosstab(index=df['Gender'], columns=df['Age'])

print(cross_table)

在上述示例中,我们创建了一个包含性别(Gender)、年龄(Age)、吸烟者(Smoker)和计数(Count)的示例数据集。然后,我们使用pd.crosstab函数对性别和年龄进行交叉表分组。

运行以上代码,你将得到类似如下的输出:

Age     Adult  Young
Gender              
Female      1      2
Male        2      1

输出结果展示了不同性别(Gender)和年龄(Age)组合的计数频率。

你可以根据自己的需求,选择不同的索引列来进行分组,以便更好地了解数据的分布和关系。

2023-05-22