1. 学ぶ
  2. /
  3. コース
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

演習

Estetyka dendrogramu

Udało się stworzyć dendrogram – ale wygląda mało efektownie!

Pakiet dendextend pozwala poprawić czytelność wykresu, kolorując gałęzie i zaznaczając klastry. dendextend działa na obiektach dendrogramu, dlatego najpierw trzeba przekonwertować hierarchiczny klaster z formatu hclust za pomocą as.dendrogram().

Dobrym sposobem na przejrzenie terminów w dendrogramie jest funkcja labels() – wyświetla ona wszystkie terminy. Aby wyróżnić konkretne gałęzie, użyj branches_attr_by_labels(). Jako pierwsze przekaż obiekt dendrogramu, potem wektor terminów, np. c("data", "camp"), a na końcu kolor, np. "blue".

Po stworzeniu wykresu możesz zaznaczyć klastry za pomocą rect.dendrogram(), która rysuje prostokąty wokół każdego klastra. Pierwszym argumentem jest dendrogram, a następnie liczba klastrów (k). Możesz też przekazać argument border, określający kolor prostokątów (np. "green").

指示

100 XP

Pakiet dendextend został już wczytany, a hierarchiczny obiekt klastrowy hc został utworzony na podstawie tweets_dist.

  • Utwórz hcd jako dendrogram, wywołując as.dendrogram() na hc.
  • Wyświetl labels obiektu hcd w konsoli.
  • Użyj branches_attr_by_labels(), aby pokolorować gałęzie. Przekaż trzy argumenty: obiekt hcd, c("marvin", "gaye") oraz kolor "red". Przypisz wynik do hcd_colored.
  • Narysuj dendrogram hcd_colored za pomocą plot(), dodając tytuł "Better Dendrogram" przez argument main.
  • Dodaj prostokąty do wykresu za pomocą rect.dendrogram(). Określ k = 2 klastry oraz kolor obramowania border równy "grey50".