LoslegenKostenlos starten

Empfindlichkeit gegenüber Ausreißern

Wenn wir die Beziehung von mehr als einer Variable analysieren, ist die Korrelation ein guter Startpunkt. Aber wie schlägt sie sich bei interessanteren Datensätzen? Wie gut hält sie Ausreißern stand?

In dieser Übung erstellst du einen Plot und berechnest die Korrelation für einen Datensatz mit einem Ausreißer, entfernst ihn anschließend und beobachtest die Änderungen. Am Ende willst du sehen, wie sich die Korrelation verhält und zu einem Fazit kommen, wann und wo du sie einsetzen solltest.

Ein Beispieldatensatz aus dem berühmten Anscombe's quartet wurde für dich als Variable df importiert, zusammen mit allen Paketen, die in diesem Kapitel bereits verwendet wurden.

Diese Übung ist Teil des Kurses

<Kurs>Statistik-Interviewfragen in Python üben</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Code bearbeiten und ausführen