Visualisation des données numériques et catégorielles
Si la variable explicative est catégorique, le diagramme de dispersion que vous avez utilisé précédemment pour visualiser les données n'a pas de sens. Une bonne solution consiste à dessiner un histogramme pour chaque catégorie.
L'ensemble des données immobilières de Taïwan comporte une variable catégorielle sous la forme de l'âge de chaque maison. Les personnes âgées ont été réparties en trois groupes : 0 à 15 ans, 15 à 30 ans et 30 à 45 ans.
taiwan_real_estate
est disponible.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Instructions
- En utilisant
taiwan_real_estate
, tracez un histogramme deprice_twd_msq
avec10
bins. Divisez la parcelle parhouse_age_years
pour obtenir 3 panneaux.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
x=____,
____=____,
____=____)
# Show the plot
____