NaN始终用作失踪的占位符,当用“
missing”替换字符串的一部分时,这仅意味着整个条目已被破坏。我听说过这种叫做NaN污染的方法(或类似方法,我会看看是否能找到一些参考文献),因为如果NaN接触到,数据就会受到损害。
也就是说,并非总是如此:
In [11]: s = pd.Series([1, 2, np.nan, 4])In [12]: s.sum()Out[12]: 7.0In [13]: s.sum(skipna=False)Out[13]: nan
在某些语言中,您会把skipna = False视为默认行为,有些人激烈地认为NaN应该 始终 污染所有数据。熊猫采取了更为务实的态度。
真正的问题是,对于NaN,您希望它做什么?



