栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

特征工程—sklearn中缺失值填充方法

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

特征工程—sklearn中缺失值填充方法

import pandas as pd
data = pd.read_csv("C:/Users/ASUS/Desktop/第四章 类别比较型图表数据/PloarRange_Data.csv")

data.info()   #探索数据

使用sklearn中的SimleImputer进行缺失值处理,sklearn提供中位数,0,众数进行填充

首先对填充方法进行实列化
from sklearn.impute import SimpleImputer  #导入缺失值处理库
imp_mean = SimpleImputer()                               #实列化,默认使用均值填充
imp_median = SimpleImputer(strategy = "median")    #使用中位数进行填
imp_0 = SimpleImputer(strategy = "constant",fill_value=0) #使用0进行填充
imp_most = SimpleImputer(strategy="most_frequent")   #使用众数进行填充
对不同的方法进行训练
imp_mean = imp_mean.fit_transform(data1.values.reshape(1,-1))
imp_median = imp_median.fit_transform(data1.values.reshape(1,-1))
imp_0  = imp_0.fit_transform(data1.values.reshape(1,-1))
imp_most = imp_most.fit_transform(data1.values.reshape(1,-1))
(注:sklearn中默认不支持一维数据输入,当数据为一维时需要使用reshape(1,-1)进行维度增加) 缺失值填充后数据

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/664079.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号