Empfindlichkeit gegenüber Ausreißern
Wenn wir die Beziehung von mehr als einer Variable analysieren, ist die Korrelation ein guter Startpunkt. Aber wie schlägt sie sich bei interessanteren Datensätzen? Wie gut hält sie Ausreißern stand?
In dieser Übung erstellst du einen Plot und berechnest die Korrelation für einen Datensatz mit einem Ausreißer, entfernst ihn anschließend und beobachtest die Änderungen. Am Ende willst du sehen, wie sich die Korrelation verhält und zu einem Fazit kommen, wann und wo du sie einsetzen solltest.
Ein Beispieldatensatz aus dem berühmten Anscombe's quartet wurde für dich als Variable df importiert, zusammen mit allen Paketen, die in diesem Kapitel bereits verwendet wurden.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in Python üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()