在 Pandas 交叉表中对索引进行分组
在Pandas中,可以使用交叉表(crosstab)函数对索引进行分组。交叉表是一种用于计算分组频率的特殊数据透视表。
下面是一个示例,演示如何使用交叉表对索引进行分组:
import pandas as pd # 创建一个示例数据集 data = { 'Gender': ['Male', 'Male', 'Female', 'Female', 'Male', 'Female'], 'Age': ['Young', 'Young', 'Adult', 'Adult', 'Adult', 'Young'], 'Smoker': ['No', 'Yes', 'Yes', 'No', 'Yes', 'No'], 'Count': [10, 20, 15, 5, 8, 12] } df = pd.DataFrame(data) # 使用交叉表对索引进行分组 cross_table = pd.crosstab(index=df['Gender'], columns=df['Age']) print(cross_table)
在上述示例中,我们创建了一个包含性别(Gender)、年龄(Age)、吸烟者(Smoker)和计数(Count)的示例数据集。然后,我们使用pd.crosstab函数对性别和年龄进行交叉表分组。
pd.crosstab
运行以上代码,你将得到类似如下的输出:
Age Adult Young Gender Female 1 2 Male 2 1
输出结果展示了不同性别(Gender)和年龄(Age)组合的计数频率。
你可以根据自己的需求,选择不同的索引列来进行分组,以便更好地了解数据的分布和关系。