1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dolování textu metodou Bag-of-Words v R

Connected

Cvičení

Úprava dendrogramu

Dendrogram máš hotový… jenže nevypadá zrovna chytlavě!

Balíček dendextend ti pomůže zaujmout publikum – umožňuje obarvit větve a vizuálně zvýraznit shluky. dendextend pracuje s objekty typu dendrogram, takže budeš muset převést hierarchický shluk z hclust pomocí as.dendrogram().

Termíny v dendrogramu si snadno prohlédneš pomocí funkce labels(), která vypíše všechny termíny. Konkrétní větve zvýrazníš funkcí branches_attr_by_labels(). Jako první předej objekt dendrogramu, pak vektor termínů jako c("data", "camp") a nakonec barvu, například "blue".

Po vytvoření grafu můžeš shluky vyznačit pomocí rect.dendrogram(), která kolem každého shluku nakreslí obdélník. Prvním argumentem je dendrogram, druhým počet shluků (k). Volitelně můžeš zadat i argument border s barvou obdélníků (např. "green").

Pokyny

100 XP

Balíček dendextend je již načtený a hierarchický shlukový objekt hc byl vytvořen z tweets_dist.

  • Vytvoř hcd jako dendrogram pomocí as.dendrogram() aplikovaného na hc.
  • Vypiš do konzole labels objektu hcd.
  • Pomocí branches_attr_by_labels() obarvi větve. Předej jí tři argumenty: objekt hcd, c("marvin", "gaye") a barvu "red". Výsledek ulož do hcd_colored.
  • Vykresli dendrogram hcd_colored pomocí plot() s titulkem "Better Dendrogram" zadaným přes argument main.
  • Přidej do grafu obdélníky pomocí rect.dendrogram(). Nastav k = 2 shluky a barvu ohraničení border na "grey50".