1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

연습 문제

GoTの死亡予測

目的変数には欠損値がありませんが、他の特徴量には欠損があります。本コースの主眼はデータクリーニングや前処理ではないため、以下の前処理はあらかじめ実施済みです。

  • NA を 0 に置換。
  • 年齢が負の値の場合は 0 に置換。
  • 年齢の NA は平均値で置換。

それでは、averaging 手法を使ってアンサンブルモデルを構築しましょう。以下の個別モデルが用意されています。

  • ロジスティック回帰(clf_lr)。
  • 決定木(clf_dt)。
  • サポートベクターマシン(clf_svm)。

目的変数は二値なので、これらはいずれも単体でも良い性能を出せる可能性があります。目標は averaging を用いてこれらを組み合わせることです。動画で学んだとおり、これは soft voting と同じなので、VotingClassifier() を使います。

지침

100 XP
  • (string, estimator) のタプルのリストを設定します。clf_lr には 'lr'、clf_dt には 'dt'、clf_svm には 'svm' を使います。
  • clf_avg という名前の averaging 分類器を作成します。voting パラメータの引数を必ず指定してください。