Pengelompokan hierarkis: Persiapan untuk eksplorasi
Anda kini telah membuat pengelompokan potensial untuk data oes. Sebelum Anda dapat mengeksplorasi klaster ini dengan ggplot2, Anda perlu memproses matriks data oes menjadi data frame rapi dengan setiap pekerjaan diberi klasternya.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Buat data frame
df_oesdari data.matrixoes, pastikan untuk menyimpan nama baris sebagai kolom (gunakanrownames_to_column()dari pustakatibble). - Bangun vektor penetapan klaster
cut_oesmenggunakancutree()denganh = 100,000. - Tambahkan penetapan klaster sebagai kolom
clusterke data framedf_oesdan simpan hasilnya ke data frame baru bernamaclust_oes. - Gunakan fungsi
pivot_longer()dari pustakatidyr()untuk mengubah bentuk data ke format yang sesuai untuk analisis ggplot2 dan simpan data frame yang telah dirapikan sebagaigathered_oes.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
dist_oes <- dist(oes, method = 'euclidean')
hc_oes <- hclust(dist_oes, method = 'average')
library(tibble)
library(tidyr)
# Use rownames_to_column to move the rownames into a column of the data frame
df_oes <- rownames_to_column(as.data.frame(___), var = 'occupation')
# Create a cluster assignment vector at h = 100,000
cut_oes <- cutree(___, h = ___)
# Generate the segmented oes data frame
clust_oes <- mutate(___, cluster = ___)
# Create a tidy data frame by gathering the year and values into two columns
gathered_oes <- pivot_longer(data = ___,
cols = -c(occupation, cluster),
names_to = "year",
values_to = "mean_salary" )