CommencerCommencer gratuitement

Regroupement hiérarchique : arbres des professions

Dans l’exercice précédent, vous avez vu que les données oes sont prêtes pour un regroupement hiérarchique sans aucune étape de prétraitement. Dans cet exercice, vous allez construire un dendrogramme des professions à partir de leurs salaires moyens annuels et proposer des groupes en utilisant une hauteur de 100,000.

Cet exercice fait partie du cours

Analyse de clusters avec R

Afficher le cours

Instructions

  • Calculez la distance euclidienne entre les professions et stockez-la dans dist_oes.
  • Exécutez un regroupement hiérarchique avec la méthode de liaison average et stockez le résultat dans hc_oes.
  • Créez un objet dendrogramme dend_oes à partir de votre résultat hclust avec la fonction as.dendrogram().
  • Tracez le dendrogramme.
  • À l’aide de la fonction color_branches(), créez et tracez un nouveau dendrogramme avec des groupes colorés selon une hauteur de coupe de 100 000.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate Euclidean distance between the occupations
dist_oes <- dist(___, method = ___)

# Generate an average linkage analysis 
hc_oes <- hclust(___, method = ___)

# Create a dendrogram object from the hclust variable
dend_oes <- as.dendrogram(___)

# Plot the dendrogram
plot(___)

# Color branches by cluster formed from the cut at a height of 100000
dend_colored <- color_branches(___, h = ___)

# Plot the colored dendrogram
plot(___)
Modifier et exécuter le code