如果您不想更改数据创建过程,则可以
class_weight在fit生成器中使用。您可以使用字典来设置您的class_weight并进行微调。例如,当不使用class_weight时,class0有50个示例,class1有100个示例。然后,损失函数统一计算损失。这意味着class1将是一个问题。但是,当您设置时:
class_weight = {0:2 , 1:1}这意味着损失函数现在将给您的0类2倍的权重。因此,对代表性不足的数据进行错误分类将比以前多付2倍的惩罚。因此,模型可以处理不平衡的数据。
如果使用
class_weight='balanced'模型,则可以自动进行该设置。但是我的建议是,创建一个类似的字典,
class_weight ={0:a1 , 1:a2}并为a1和a2尝试不同的值,这样您就可以理解差异。此外,您可以对数据不均衡使用欠采样方法,而不要使用class_weight。为此,请检查 _ 引导_ 方法。



