Pengelompokan hierarkis: Persiapan untuk eksplorasi
Anda kini telah membuat pengelompokan potensial untuk data oes. Sebelum Anda dapat mengeksplorasi klaster ini dengan ggplot2, Anda perlu memproses matriks data oes menjadi data frame rapi dengan setiap pekerjaan diberi klasternya.
Latihan ini merupakan bagian dari kursus
Analisis Klaster di R
Instruksi latihan
- Buat data frame
df_oesdari data.matrixoes, pastikan untuk menyimpan nama baris sebagai kolom (gunakanrownames_to_column()dari pustakatibble). - Bangun vektor penetapan klaster
cut_oesmenggunakancutree()denganh = 100,000. - Tambahkan penetapan klaster sebagai kolom
clusterke data framedf_oesdan simpan hasilnya ke data frame baru bernamaclust_oes. - Gunakan fungsi
pivot_longer()dari pustakatidyr()untuk mengubah bentuk data ke format yang sesuai untuk analisis ggplot2 dan simpan data frame yang telah dirapikan sebagaigathered_oes.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
dist_oes <- dist(oes, method = 'euclidean')
hc_oes <- hclust(dist_oes, method = 'average')
library(tibble)
library(tidyr)
# Use rownames_to_column to move the rownames into a column of the data frame
df_oes <- rownames_to_column(as.data.frame(___), var = 'occupation')
# Create a cluster assignment vector at h = 100,000
cut_oes <- cutree(___, h = ___)
# Generate the segmented oes data frame
clust_oes <- mutate(___, cluster = ___)
# Create a tidy data frame by gathering the year and values into two columns
gathered_oes <- pivot_longer(data = ___,
cols = -c(occupation, cluster),
names_to = "year",
values_to = "mean_salary" )