Statistiche riassuntive efficienti
Anche se pandas e NumPy offrono molte funzioni integrate, a volte potresti aver bisogno di qualcosa di più specifico per riassumere i tuoi dati.
Il metodo .agg()
ti permette di utilizzare funzioni personalizzate su un DataFrame e di applicarle anche a più colonne contemporaneamente, rendendo le tue aggregazioni molto più efficienti. Ad esempio:
df['column'].agg(function)
Nella funzione personalizzata di questo esercizio, "IQR" è l’abbreviazione di intervallo interquartile, ovvero la differenza tra il 75° e il 25° percentile. Si tratta di un’alternativa alla deviazione standard che può essere utile quando i dati contengono valori anomali (outlier).
sales
è a tua disposizione e pandas
è già stato caricato come pd
.
Questo esercizio fa parte del corso
Manipolazione dei dati con pandas
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# A custom IQR function
def iqr(column):
return column.quantile(0.75) - column.quantile(0.25)
# Print IQR of the temperature_c column
print(____)