栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

在sklearn中使用RandomForestClassifier进行不平衡分类

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

在sklearn中使用RandomForestClassifier进行不平衡分类

您可以将样本权重参数传递给随机森林拟合方法

sample_weight : array-like, shape = [n_samples] or None

样品重量。如果为None,则对样本进行平均加权。在每个节点中搜索拆分时,将忽略创建净净值为零或负权重的子节点的拆分。在分类的情况下,如果拆分会导致任何单个类在任一子节点中都具有负权重,则也将忽略拆分。

在较旧的版本中,存在一种

preprocessing.balance_weights
为给定样本生成平衡权重的方法,以使类别变得均匀分布。它仍然存在,在内部但仍可用的preprocessing._weights模块中,但已不建议使用,并将在以后的版本中删除。不知道确切的原因。

更新资料

有些澄清,您似乎很困惑。

sample_weight
一旦记住它的目的是平衡训练数据集中的目标类别,用法就很简单。也就是说,如果您具有
X
作为观测值和
y
作为类(标签),则
len(X)== len(y) == len(sample_wight)
sample witght
1维数组的每个元素代表对应对的权重
(observation,label)
。对于您的情况,如果将
1
类表示为
0
类的5次,并且平衡类分布,则可以使用简单

sample_weight = np.array([5 if i == 0 else 1 for i in y])

分配

5
所有
0
实例的权重和
1
所有
1
实例的权重。请参阅上面的链接以获取更多巧妙的
balance_weights
权重评估功能。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/645109.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号