IniziaInizia gratis

Calcolare le medie per categoria

Un buon modo per esplorare più a fondo le variabili categoriche è calcolare le statistiche riassuntive per ciascuna categoria. Ad esempio, puoi calcolare media e mediana della variabile di risposta, raggruppando per una variabile categorica. In questo modo puoi confrontare ogni categoria in modo più dettagliato.

Qui esaminerai le medie raggruppate dei prezzi delle case nel dataset immobiliare di Taiwan. Questo ti aiuterà a capire l'output di una regressione lineare con una variabile categorica.

taiwan_real_estate è disponibile come pandas DataFrame.

Questo esercizio fa parte del corso

Introduzione alla regressione con statsmodels in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Raggruppa taiwan_real_estate per house_age_years e calcola il prezzo medio (price_twd_msq) per ciascun gruppo di età. Assegna il risultato a mean_price_by_age.
  • Stampa il risultato ed esamina l'output.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Modifica ed esegui il codice