1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶ Mixture Models

Connected

演習

クラスタを可視化する

ここまでで、観測値と、クラスタを表す楕円を一緒にプロットするために必要な準備が整いました。

また、各観測値を2つのクラスタのいずれかに割り当てたい場合は、clusters() 関数を使って結果を実ラベルと比較できます。念のため振り返ると、変数 Weight のみでクラスタリングしたときは、4500 人の女性と 4556 人の男性を正しく予測できました。追加の変数を取り入れたとき、よりうまくクラスタを分離できるか見てみましょう。

指示

100 XP
  • geom_point() を使って、Weight と BMI の散布図を作成します。このプロットに、geom_path() で ellipses_comp_number に保存した2つの楕円を追加します。
  • 楕円はデータフレームに変換してから使用してください。
  • クラスタ1は赤、クラスタ2は青で色付けします。
  • 変数 Gender に格納された実ラベルと、clusters が推定した予測ラベルのクロス集計表(度数表)を作成して評価します。