1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 scikit-learn 的监督学习

Connected

道练习

使用 RandomizedSearchCV 进行超参数调优

正如您所见,GridSearchCV 的计算开销可能很大,尤其是在搜索空间很大时。此时可以使用 RandomizedSearchCV,它会从给定的概率分布中抽取固定数量的超参数组合进行测试。

来自 diabetes_df 的训练集和测试集已为您预加载为 X_train、X_test、y_train 和 y_test,目标变量为 "diabetes"。已经创建了一个逻辑回归模型并存为 logreg,以及一个 KFold 变量并存为 kf。

您将定义一组超参数范围,并使用已从 sklearn.model_selection 导入的 RandomizedSearchCV,在这些选项中寻找最优超参数。

说明

100 XP
  • 创建 params:将 "l1" 和 "l2" 作为 penalty 的取值,将 C 设为 0.1 到 1.0 之间的 50 个浮点数范围,并将 class_weight 设为 "balanced" 或包含 0:0.8, 1:0.2 的字典。
  • 创建 Randomized Search CV 对象,传入模型与参数,并将 cv 设为 kf。
  • 将 logreg_cv 拟合到训练数据。
  • 打印模型的最优参数和准确率分数。