1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

演習

Bagging のハイパーパラメータを調整する

デフォルトのパラメータでも bagging classifier は簡単に構築できますが、最適な性能を出すにはパラメータ調整を行うことを強くおすすめします。理想的には、K-fold 交差検証で最適化すべきです。

この演習では、bagging classifier のパラメータを変更してモデル性能を改善できるか試してみます。

また、計算時間を短縮するために、LogisticRegression には solver='liblinear' を渡しています。

指示

100 XP
  • ロジスティック回帰をベース学習器として用いた bagging classifier を構築し、ベース推定器を 20 個、最大特徴量数を 10、最大サンプル数(max_samples)を 0.65(65%)、サンプルは非復元抽出(置き換えなし)にします。
  • clf_bag を使ってテストセット X_test のラベルを予測します。