MulaiMulai sekarang secara gratis

Pengelompokan hierarkis: Persiapan untuk eksplorasi

Anda kini telah membuat pengelompokan potensial untuk data oes. Sebelum Anda dapat mengeksplorasi klaster ini dengan ggplot2, Anda perlu memproses matriks data oes menjadi data frame rapi dengan setiap pekerjaan diberi klasternya.

Latihan ini adalah bagian dari kursus

Analisis Klaster di R

Lihat Kursus

Petunjuk latihan

  • Buat data frame df_oes dari data.matrix oes, pastikan untuk menyimpan nama baris sebagai kolom (gunakan rownames_to_column() dari pustaka tibble).
  • Bangun vektor penetapan klaster cut_oes menggunakan cutree() dengan h = 100,000.
  • Tambahkan penetapan klaster sebagai kolom cluster ke data frame df_oes dan simpan hasilnya ke data frame baru bernama clust_oes.
  • Gunakan fungsi pivot_longer() dari pustaka tidyr() untuk mengubah bentuk data ke format yang sesuai untuk analisis ggplot2 dan simpan data frame yang telah dirapikan sebagai gathered_oes.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

dist_oes <- dist(oes, method = 'euclidean')
hc_oes <- hclust(dist_oes, method = 'average')

library(tibble)
library(tidyr)

# Use rownames_to_column to move the rownames into a column of the data frame
df_oes <- rownames_to_column(as.data.frame(___), var = 'occupation')

# Create a cluster assignment vector at h = 100,000
cut_oes <- cutree(___, h = ___)

# Generate the segmented oes data frame
clust_oes <- mutate(___, cluster = ___)

# Create a tidy data frame by gathering the year and values into two columns
gathered_oes <- pivot_longer(data = ___, 
                       cols = -c(occupation, cluster),
                       names_to = "year",               
                       values_to = "mean_salary" )
Edit dan Jalankan Kode