1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

Exercises

デンドログラムの見た目を整える

デンドログラムは作れましたが、思ったほど目を引く見た目ではないですね。

dendextend パッケージを使うと、枝に色を付けたり、クラスターの外枠を描いたりして、見る人にとってわかりやすくできます。dendextend はデンドログラムオブジェクトを対象に動作するため、hclust で作った階層的クラスタリング結果は as.dendrogram() で変換する必要があります。

デンドログラム内の用語を確認するには、labels() 関数が便利です。すべての用語が表示されます。特定の枝を強調したいときは、branches_attr_by_labels() を使います。最初にデンドログラムオブジェクトを渡し、次に c("data", "camp") のような用語のベクトル、最後に "blue" のような色を指定します。

プロットを作成した後、rect.dendrogram() でクラスターを囲むことができます。各クラスターに長方形が追加されます。rect.dendrogram() の第1引数はデンドログラム、続いてクラスター数(k)です。さらに、長方形の色を指定する border 引数(例: "green")も渡せます。

คำแนะนำ

100 XP

dendextend パッケージは読み込まれており、tweets_dist から作成した階層クラスタリングオブジェクト hc が用意されています。

  • hc に対して as.dendrogram() を使い、デンドログラムとして hcd を作成します。
  • hcd の labels をコンソールに出力します。
  • branches_attr_by_labels() を使って枝に色を付けます。3つの引数を渡してください: hcd オブジェクト、c("marvin", "gaye")、色 "red"。結果を hcd_colored に代入します。
  • デンドログラム hcd_colored を plot() し、main 引数でタイトル "Better Dendrogram" を付けます。
  • rect.dendrogram() を使ってプロットに長方形を追加します。k = 2 のクラスター数を指定し、border の色は "grey50" にします。