Boîtes à moustaches et courbes de densité
La consommation d’une voiture est généralement liée à la taille de son moteur (mesurée par le nombre de cylindres). Pour explorer la relation entre ces deux variables, vous pourriez vous en tenir aux histogrammes, mais dans cet exercice vous allez essayer deux alternatives : le graphique en boîtes à moustaches et la courbe de densité.
Cet exercice fait partie du cours
Analyse exploratoire des données en R
Instructions
Un rapide coup d’œil à unique(cars$ncyl) montre qu’il existe plus de modalités possibles pour ncyl que vous ne pourriez le penser. Ici, concentrez-vous sur les modalités les plus courantes.
- Filtrez
carspour ne conserver que les voitures avec 4, 6 ou 8 cylindres et enregistrez le résultat danscommon_cyl. L’opérateur%in%peut s’avérer utile ici. - Créez des boîtes à moustaches côte à côte de
city_mpgséparées parncyl. - Créez des courbes de densité superposées de
city_mpgcolorées selonncyl.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter cars with 4, 6, 8 cylinders
common_cyl <- filter(___, ___)
# Create box plots of city mpg by ncyl
ggplot(___, aes(x = as.factor(___), y = ___)) +
geom_boxplot()
# Create overlaid density plots for same data
ggplot(common_cyl, aes(x = ___, fill = as.factor(___))) +
geom_density(alpha = .3)