CommencerCommencer gratuitement

Diagramme en épine (spine plot)

Le graphique d’agrégation que vous avez tracé dans l’exercice précédent vous a donné une vue d’ensemble des données manquantes. Si vous souhaitez explorer l’interaction entre des variables précises, le diagramme en épine est tout indiqué. Il permet d’étudier le pourcentage de valeurs manquantes d’une variable en fonction des différentes valeurs d’une autre, ce qui est conceptuellement très proche des tests t que vous avez effectués dans la leçon précédente.

Dans cet exercice, vous allez tracer un diagramme en épine pour analyser le pourcentage de données manquantes dans earnings selon les différentes catégories de sub_race. Y a-t-il davantage de valeurs manquantes sur les revenus pour certaines races du personnage principal du film ? Voyons cela ! Le package VIM a déjà été chargé pour vous.

Cet exercice fait partie du cours

Gérer les données manquantes avec des imputations en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Draw a spine plot to analyse missing values in earnings by sub_race
biopics %>% 
	select(___, ___) %>%
	___()
Modifier et exécuter le code