栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

sklearn onehot后和原来特征一起fit

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

sklearn onehot后和原来特征一起fit

from sklearn.preprocessing import oneHotEncoder
ddd2 = pd.Dataframe({'f1': [1, 2, 3, 4, 5, 6], 'f2': ['你', '我', '他', '你', '我', '她'], 'y': [1, 1, 1, 0, 0, 0]})
ddd2

one = OneHotEncoder()
ddd2['f2'] = one.fit_transform(ddd2['f2'].values.reshape(-1, 1))
ddd2


ddd2['index'] = ddd2.index
def indexapply(index, x):
    return np.float64(x.toarray())[index, :]

ddd2['f2'] = ddd2.apply(lambda row: indexapply(row['index'], row['f2']), axis=1)
ddd2 = ddd2.drop('index', axis=1)
ddd2

from sklearn.ensemble import GradientBoostingClassifier
x2, y2 = ddd2.iloc[:, :-1].values, ddd2.iloc[:, -1].values
print(x2)
print(y2)

def flatten_x_cols(lst):
    res = []
    for i in range(len(lst)):
        lsnew = []
        lsnew.append(lst[i][0])
        for j in lst[i][1]:
            lsnew.append(j)
        res.append(lsnew)
    return res

x2 = flatten_x_cols(x2)


model = GradientBoostingClassifier()
model.fit(x2, y2)
[[1 array([0., 1., 0., 0.])]
 [2 array([0., 0., 0., 1.])]
 [3 array([1., 0., 0., 0.])]
 [4 array([0., 1., 0., 0.])]
 [5 array([0., 0., 0., 1.])]
 [6 array([0., 0., 1., 0.])]]
[1 1 1 0 0 0]
GradientBoostingClassifier()

sklearn 将onehot之后的结果拼接回原来的dataframe
https://blog.csdn.net/qq_42363032/article/details/121377220

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/757696.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号