1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w R

Connected

ćwiczenie

Grupowanie hierarchiczne: przygotowanie do eksploracji

Masz już gotowy podział danych oes na potencjalne skupienia. Zanim zaczniesz je eksplorować za pomocą ggplot2, musisz przekształcić macierz danych oes w uporządkowaną ramkę danych, w której każdy zawód ma przypisane swoje skupienie.

Instrukcje

100 XP
  • Utwórz ramkę danych df_oes na podstawie macierzy danych oes, pamiętając o zapisaniu nazw wierszy jako osobnej kolumny (użyj funkcji rownames_to_column() z biblioteki tibble).
  • Zbuduj wektor przypisań do skupień cut_oes, używając funkcji cutree() z parametrem h = 100,000.
  • Dołącz przypisania do skupień jako kolumnę cluster do ramki danych df_oes i zapisz wynik jako nową ramkę danych o nazwie clust_oes.
  • Użyj funkcji pivot_longer() z biblioteki tidyr(), aby przekształcić dane do formatu odpowiedniego dla ggplot2, i zapisz uporządkowaną ramkę danych jako gathered_oes.