1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Mixture Models v R

Connected

cvičení

Vizualizace clusterů

V tuto chvíli máme vše potřebné k tomu, abychom mohli vykreslit pozorování spolu s elipsami reprezentujícími jednotlivé clustery.

Pokud chceme každé pozorování přiřadit do jednoho ze dvou clusterů, můžeme použít funkci clusters() a porovnat výsledky se skutečnými popisky. Jen pro připomenutí: když jsme pro shlukování dat používali pouze proměnnou Weight, správně jsme zařadili 4500 žen a 4556 mužů. Pojďme zjistit, jestli se nám podaří clustery lépe oddělit po přidání další proměnné.

Pokyny

100 XP
  • Pomocí geom_point() vytvoř bodový graf pro proměnné Weight a BMI. Do tohoto grafu přidej dvě elipsy uložené v ellipses_comp_number pomocí funkce geom_path().
  • Nezapomeň, že elipsy je nejprve potřeba převést na datový rámec.
  • Cluster 1 obarvi červeně a cluster 2 modře.
  • Sestav frekvenční tabulku skutečných popisků uložených v proměnné Gender oproti předpovězeným hodnotám odhadnutým pomocí clusters.