Python-NaN和None有什么区别？

一尘不染

Python-NaN和None有什么区别？

python

我正在使用pandas读取csv文件的两列，readcsv()然后将值分配给字典。这些列包含数字和字母字符串。有时在某些情况下单元格为空。在我看来，应读取None但应nan分配该字典条目的值。当然None，由于它具有空值，因此更能描述一个空单元格，而nan只是说读取的值不是数字。

我的理解正确吗，None和之间有什么区别nan？为什么nan分配而不是None？

另外，我的字典检查是否有任何空单元格一直在使用numpy.isnan()：

for k, v in my_dict.iteritems():
    if np.isnan(v):

但这给了我一个错误，说我不能使用此检查v。我猜这是因为要使用整数或浮点变量，而不是字符串。如果是这样，如何检查v“空单元格” / nan大小写？

阅读 1814

2020-02-22

共1个答案

一尘不染

在我看来，使用NaN（而不是None）的主要原因是它可以与numpy的float64 dtype一起存储，而不是效率较低的object dtype，请参阅NA type Promotions 。

#  without forcing dtype it changes None to NaN!
s_bad = pd.Series([1, None], dtype=object)
s_good = pd.Series([1, np.nan])

In [13]: s_bad.dtype
Out[13]: dtype('O')

In [14]: s_good.dtype
Out[14]: dtype('float64')

杰夫对此评论（如下）：

np.nan允许向量化操作；它是一个float值，而None根据定义，它强制对象类型，这基本上禁用了numpy中的所有效率。

因此，快速重复3次：object ==bad，float == good

说，许多操作在None vs NaN上仍然可以正常工作（但可能不受支持，即有时可能会产生令人惊讶的结果）：

In [15]: s_bad.sum()
Out[15]: 1

In [16]: s_good.sum()
Out[16]: 1.0

要回答第二个问题：
你应该使用pd.isnull并pd.notnull测试丢失的数据（NaN）。

2020-02-22