Individuare gli outlier usando l'IQR
Gli outlier possono avere un forte impatto su statistiche come la media, e su quelle che dipendono dalla media, come varianza e deviazione standard. L’intervallo interquartile, o IQR, è un altro modo di misurare la dispersione, meno influenzato dagli outlier. L’IQR è spesso usato anche per trovarli. Se un valore è minore di \(\text{Q1} - 1.5 \times \text{IQR}\) o maggiore di \(\text{Q3} + 1.5 \times \text{IQR}\), è considerato un outlier. In effetti, è così che vengono calcolate le lunghezze dei baffi in un box plot di matplotlib.

In questo esercizio calcolerai l’IQR e lo userai per individuare alcuni outlier. pandas come pd e numpy come np sono già caricati e food_consumption è disponibile.
Questo esercizio fa parte del corso
Introduzione alla statistica in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate total co2_emission per country: emissions_by_country
emissions_by_country = ____
print(emissions_by_country)