Aan de slagGa gratis aan de slag

Gevoeligheid voor uitschieters

Als we de relatie tussen meer dan één variabele analyseren, is correlatie een goed begin. Maar hoe houdt correlatie stand bij interessantere datasets? Hoe goed gaat het om met uitschieters?

In deze oefening maak je een plot en bereken je de correlatie voor een dataset met een uitschieter. Daarna verwijder je die en kijk je wat er verandert. Uiteindelijk wil je zien hoe correlatie presteert en tot een conclusie komen over wanneer en waarvoor je het zou moeten gebruiken.

Een voorbeeldsubset uit het beroemde Anscombe's quartet is voor je geïmporteerd als de variabele df, samen met alle pakketten die eerder in dit hoofdstuk zijn gebruikt.

Deze oefening maakt deel uit van de cursus

Statistiek-vragen voor sollicitaties oefenen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Code bewerken en uitvoeren