Aggregare variabili numeriche
Un buon caso d’uso per creare una nuova variabile tramite una statistica aggregata è quando hai molte variabili con valori simili o correlati. Qui hai un DataFrame con i tempi di corsa chiamato running_times_5k. Per ogni name nell’insieme di dati, calcola la media dei 5 tempi di corsa.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Usa il metodo
.loc[]per selezionare tutte le righe e le colonne su cui calcolare la.mean()di ciascuna colonna. - Stampa il
.head()del DataFrame per vedere la colonnamean.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)