栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

scikit-learn中处理nan / null的分类器

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

scikit-learn中处理nan / null的分类器

我做了一个例子,其中包含训练中缺少的值和测试集

我只是使用

SimpleImputer
类选择了一种策略,用均值替换丢失的数据。还有其他策略。

from __future__ import print_functionimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.impute import SimpleImputerX_train = [[0, 0, np.nan], [np.nan, 1, 1]]Y_train = [0, 1]X_test_1 = [0, 0, np.nan]X_test_2 = [0, np.nan, np.nan]X_test_3 = [np.nan, 1, 1]# Create our imputer to replace missing values with the mean e.g.imp = SimpleImputer(missing_values=np.nan, strategy='mean')imp = imp.fit(X_train)# Impute our data, then trainX_train_imp = imp.transform(X_train)clf = RandomForestClassifier(n_estimators=10)clf = clf.fit(X_train_imp, Y_train)for X_test in [X_test_1, X_test_2, X_test_3]:    # Impute each test item, then predict    X_test_imp = imp.transform(X_test)    print(X_test, '->', clf.predict(X_test_imp))# Results[0, 0, nan] -> [0][0, nan, nan] -> [0][nan, 1, 1] -> [1]


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/660935.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号