scikit-learn不支持缺少值。 以前在邮件列表上已经对此进行了讨论,但是没有尝试实际编写代码来处理它们。
无论您做什么, 都不要 使用NaN编码缺失值,因为许多算法都拒绝处理包含NaN的样本。
上面的答案已经过时;最新版本的scikit-learn具有一个类
Imputer,该类可以进行简单的针对每个功能的缺失值估算。您可以向其提供包含NaN的数组,以将其替换为相应特征的均值,中位数或众数。

scikit-learn不支持缺少值。 以前在邮件列表上已经对此进行了讨论,但是没有尝试实际编写代码来处理它们。
无论您做什么, 都不要 使用NaN编码缺失值,因为许多算法都拒绝处理包含NaN的样本。
上面的答案已经过时;最新版本的scikit-learn具有一个类
Imputer,该类可以进行简单的针对每个功能的缺失值估算。您可以向其提供包含NaN的数组,以将其替换为相应特征的均值,中位数或众数。