正解率を計算する

データを学習用とテスト用に分割したので、まずはモデルを「学習用」データに適合させ、続いて「テスト」データのラベルを予測できます。今回はその一連の流れを練習します。

これまでに Logistic Regression と Decision Trees を使ってきました。ここでは RandomForestClassifier を使います。これは複数の Decision Tree からなるアンサンブルで、一般に単一の Decision Tree より高い性能が期待できます。

前の演習で準備した内容は引き継がれており、学習用とテスト用のデータは、X_train、X_test、y_train、y_test の各変数として利用できます。