Aan de slagGa gratis aan de slag

Uitschieters identificeren

Laten we doorgaan met onze laptops-gegevensset en een paar verborgen uitschieters aanpakken. In deze oefening blijven we bij de eerste techniek die we in de dia's bespraken: standaarddeviaties gebruiken om extreme waarden te identificeren, omdat deze methode in de praktijk het meest voorkomt.

Je berekent de beschrijvende statistieken en de grenzen voor uitschieters, en identificeert vervolgens de rijen om ze daarna uit de gegevensset te verwijderen. Je werkt hier vooral met de kolom Price.

Deze oefening maakt deel uit van de cursus

Statistiek-vragen voor sollicitaties oefenen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the mean and std
mean, std = ____, ____
Code bewerken en uitvoeren