Calcolare le medie per categoria
Un buon modo per esplorare più a fondo le variabili categoriche è calcolare le statistiche riassuntive per ciascuna categoria. Ad esempio, puoi calcolare media e mediana della variabile di risposta, raggruppando per una variabile categorica. In questo modo puoi confrontare ogni categoria in modo più dettagliato.
Qui esaminerai le medie raggruppate dei prezzi delle case nel dataset immobiliare di Taiwan. Questo ti aiuterà a capire l'output di una regressione lineare con una variabile categorica.
taiwan_real_estate è disponibile come pandas DataFrame.
Questo esercizio fa parte del corso
Introduzione alla regressione con statsmodels in Python
Istruzioni dell'esercizio
- Raggruppa
taiwan_real_estateperhouse_age_yearse calcola il prezzo medio (price_twd_msq) per ciascun gruppo di età. Assegna il risultato amean_price_by_age. - Stampa il risultato ed esamina l'output.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)