1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクラスタ分析

Connected

演習

matplotlib でクラスターを可視化する

クラスターの妥当性を評価したり、データの傾向を見つけたりするには、可視化が欠かせないことを学びました。ここでは、matplotlib モジュールを使って、Comic-Con の来場者データ(footfall データセット)を可視化してみましょう。

データは pandas の DataFrame comic_con に保存されています。x_scaled と y_scaled は、ある時点における人の標準化された X・Y 座標の列名です。cluster_labels にはクラスターラベルが入っています。リンケージオブジェクトは変数 distance_matrix に保存されています。

指示

100 XP
  • matplotlib モジュールから pyplot クラスを plt としてインポートします。
  • 2 つのクラスターラベル 1 と 2 に対する colors 辞書を定義します。
  • colors 辞書で定義した各クラスターの色を使って散布図を描画します。