Ausreißer finden mit IQR
Ausreißer können große Auswirkungen auf Statistiken wie den Mittelwert haben, aber auch auf Statistiken, die auf dem Mittelwert basieren, wie Varianz und Standardabweichung. Der Interquartilsbereich (IQR) ist eine weitere Methode zur Messung der Streuung, die weniger von Ausreißern beeinflusst wird. IQR wird auch oft verwendet, um Ausreißer zu finden. Wenn ein Wert kleiner als \(\text{Q1} - 1.5 \times \text{IQR}\) oder größer als \(\text{Q3} + 1.5 \times \text{IQR}\) ist, wird er als Ausreißer betrachtet. So werden die Längen der Whisker in einem matplotlib
-Box-Plot berechnet.
In dieser Übung berechnest du den IQR und verwendest ihn, um einige Ausreißer zu finden. pandas
als pd
und numpy
als np
sind geladen, und food_consumption
ist verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Statistik in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Calculate total co2_emission per country: emissions_by_country
emissions_by_country = ____
print(emissions_by_country)