データの前処理

クラスタリング前の前処理は、より正確にセグメンテーションするための下準備になります。前処理の一種である特徴量スケーリングは、データに含まれる独立変数を固定範囲（例：0-1 や 0-100）に標準化する手法です。

この演習では、performance として読み込まれた学生の成績データセットの parental_level_of_education 列と writing_score 列に対してクラスタリングを行います。まず、前処理なしで k-means モデルを作成して実行します。次に、特徴量スケーリングで前処理を行ってから、同様に実行します。

プライベート k-means モデルは diffprivlib.models から KMeans としてインポート済みです。スケーリング用の StandardScaler と次元削減の PCA は sklearn からインポート済みです。