Uitschieters identificeren
Laten we doorgaan met onze laptops-gegevensset en een paar verborgen uitschieters aanpakken. In deze oefening blijven we bij de eerste techniek die we in de dia's bespraken: standaarddeviaties gebruiken om extreme waarden te identificeren, omdat deze methode in de praktijk het meest voorkomt.
Je berekent de beschrijvende statistieken en de grenzen voor uitschieters, en identificeert vervolgens de rijen om ze daarna uit de gegevensset te verwijderen. Je werkt hier vooral met de kolom Price.
Deze oefening maakt deel uit van de cursus
Statistiek-vragen voor sollicitaties oefenen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the mean and std
mean, std = ____, ____