小能豆

如何计算 pandas DataFrame 中某一列的 NaN 值?

javascript

如何计算 pandas DataFrame 中某一列的 NaN 值?


阅读 37

收藏
2024-09-25

共1个答案

小能豆

要计算 Pandas DataFrame 中某一列的 NaN 值,你可以使用 isna()isnull() 方法结合 sum() 函数。下面是具体的方法:

示例代码

假设你有一个 DataFrame df,并且你想计算列 'column_name' 中的 NaN 值数量:

import pandas as pd
import numpy as np

# 创建一个示例 DataFrame
data = {
    'column_name': [1, 2, np.nan, 4, np.nan, 6]
}
df = pd.DataFrame(data)

# 计算 NaN 值的数量
nan_count = df['column_name'].isna().sum()

print(f"NaN 值的数量: {nan_count}")

解释

  • df['column_name'].isna() 会返回一个布尔 Series,指示每个值是否为 NaN。
  • sum() 方法会对布尔 Series 进行求和,True 会被当作 1 计算,False 会被当作 0 计算,因此返回的结果就是 NaN 值的数量。

使用 isnull()

你也可以使用 isnull() 方法,效果是一样的:

nan_count = df['column_name'].isnull().sum()

结果

运行以上代码后,你将得到 'column_name' 列中 NaN 值的数量。

2024-09-25