1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

연습 문제

もう少し複雑なバギングモデル

半導体データを見てきましたので、次は入力特徴量から 'Pass/Fail' ラベルを予測するバギング分類器を構築しましょう。

前処理済みデータセットは作業スペースに uci_secom として用意されており、学習用とテスト用のデータも作成済みです。

目的変数に強いクラス不均衡があるため、ここではベース推定器として "balanced" のロジスティック回帰を使用してください。

また、LogisticRegression の計算時間を短縮するために、デフォルトより高速な最適化手法である solver='liblinear' を使用します。

지침

100 XP
  • ベース分類器として使用するロジスティック回帰を、class_weight='balanced'、solver='liblinear'、random_state=42 のパラメータでインスタンス化します。
  • ベース推定器にロジスティック回帰を用いたバギング分類器を構築し、最大特徴量数を 10、さらに out-of-bag スコアを有効化してください。
  • out-of-bag スコアを出力して、精度と比較しましょう。