目的:防止模型在训练集上过拟合,导致在测试上表现不好,使用验证集筛选出最优参数。
交叉验证仍需要测试集做最后的模型评估,但不再需要验证集。
最基本的方法被称之为,k-折交叉验证 。 k-折交叉验证将训练集划分为 k 个较小的集合(其他方法会在下面描述,主要原则基本相同)。 每一个 k 折都会遵循下面的过程:
- 将 k-1 份训练集子集作为 training data (训练集)训练模型,
- 将剩余的 1 份训练集子集用于模型验证(也就是把它当做一个测试集来计算模型的性能指标,例如准确率)。
- HistGradientBoostingRegressor
- LightGBM



