過学習と未学習

モデルの複雑さを解釈することは、教師あり学習のパフォーマンスを評価する上で重要な手法です。目標は、特徴量と目的変数の関係を正確に捉えつつ、未知のデータにもうまく汎化できるモデルを構築することです。

訓練セットとテストセットは churn_df データセットから作成済みで、X_train、X_test、y_train、y_test としてあらかじめ読み込まれています。

また、KNeighborsClassifier と numpy（np）もインポート済みです。