1. 学ぶ
  2. /
  3. コース
  4. /
  5. マーケティングアナリティクス:Pythonで顧客解約を予測する

Connected

演習

正解率を計算する

データを学習用とテスト用に分割したので、まずはモデルを「学習用」データに適合させ、続いて「テスト」データのラベルを予測できます。今回はその一連の流れを練習します。

これまでに Logistic Regression と Decision Trees を使ってきました。ここでは RandomForestClassifier を使います。これは複数の Decision Tree からなるアンサンブルで、一般に単一の Decision Tree より高い性能が期待できます。

前の演習で準備した内容は引き継がれており、学習用とテスト用のデータは、X_train、X_test、y_train、y_test の各変数として利用できます。

指示

100 XP
  • sklearn.ensemble から RandomForestClassifier をインポートします。
  • RandomForestClassifier のインスタンスを clf として作成します。
  • 学習用データ X_train と y_train に対して clf を学習させます。
  • .score() メソッドを使って、テストデータ上での clf の正解率を計算します。