CommencerCommencer gratuitement

Visualisation des données numériques et catégorielles

Si la variable explicative est catégorique, le diagramme de dispersion que vous avez utilisé précédemment pour visualiser les données n'a pas de sens. Une bonne solution consiste à dessiner un histogramme pour chaque catégorie.

L'ensemble des données immobilières de Taïwan comporte une variable catégorielle sous la forme de l'âge de chaque maison. Les personnes âgées ont été réparties en trois groupes : 0 à 15 ans, 15 à 30 ans et 30 à 45 ans.

taiwan_real_estate est disponible.

Cet exercice fait partie du cours

Introduction à la régression avec statsmodels en Python

Afficher le cours

Instructions

  • En utilisant taiwan_real_estate, tracez un histogramme de price_twd_msq avec 10 bins. Divisez la parcelle par house_age_years pour obtenir 3 panneaux.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
         x=____,
         ____=____,
         ____=____)

# Show the plot
____
Modifier et exécuter le code