Visualizzare numeriche vs. categoriche
Se la variabile esplicativa è categorica, lo scatter plot che hai usato prima per visualizzare i dati non ha senso. Una buona alternativa è disegnare un istogramma per ciascuna categoria.
L'insieme di dati del mercato immobiliare di Taiwan include una variabile categorica che rappresenta l'età di ciascuna casa. Le età sono state suddivise in 3 gruppi: da 0 a 15 anni, da 15 a 30 anni e da 30 a 45 anni.
taiwan_real_estate è disponibile.
Questo esercizio fa parte del corso
Introduzione alla regressione con statsmodels in Python
Istruzioni dell'esercizio
- Usando
taiwan_real_estate, traccia un istogramma diprice_twd_msqcon10bin. Suddividi il grafico perhouse_age_yearsper ottenere 3 pannelli.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
x=____,
____=____,
____=____)
# Show the plot
____