GoTの死亡予測

目的変数には欠損値がありませんが、他の特徴量には欠損があります。本コースの主眼はデータクリーニングや前処理ではないため、以下の前処理はあらかじめ実施済みです。

NA を 0 に置換。
年齢が負の値の場合は 0 に置換。
年齢の NA は平均値で置換。

それでは、averaging 手法を使ってアンサンブルモデルを構築しましょう。以下の個別モデルが用意されています。

ロジスティック回帰（clf_lr）。
決定木（clf_dt）。
サポートベクターマシン（clf_svm）。

目的変数は二値なので、これらはいずれも単体でも良い性能を出せる可能性があります。目標は averaging を用いてこれらを組み合わせることです。動画で学んだとおり、これは soft voting と同じなので、VotingClassifier() を使います。

(string, estimator) のタプルのリストを設定します。clf_lr には 'lr'、clf_dt には 'dt'、clf_svm には 'svm' を使います。
clf_avg という名前の averaging 分類器を作成します。voting パラメータの引数を必ず指定してください。