1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

연습 문제

ブートストラップで学習する

それでは、「弱い」決定木分類器を作成し、置換ありで抽出したトレーニングセットのサンプルに対して学習させましょう。これにより、バギングアンサンブルの各反復で何が起きるかを理解できます。

サンプリングには、pandas の .sample() メソッドを使います。このメソッドには replace パラメータがあります。例えば、次のコードは DataFrame df 全体から置換ありでサンプルを抽出します:

df.sample(frac=1.0, replace=True, random_state=42)

지침

100 XP
  • トレーニングセット X_train 全体(frac=1.0)から、置換あり(replace=True)でサンプルを抽出します。
  • パラメータ max_depth = 4 を使って決定木分類器を作成します。
  • サンプリングしたトレーニングデータにモデルを適合させます。