Aan de slagGa gratis aan de slag

Z-score-standardisatie

In de vorige oefening heb je de Z-score berekend om uitbijters aan te pakken. In een Machine Learning-sollicitatiegesprek kan ook worden gevraagd waar Z-scores nog meer voor worden gebruikt. Ze worden vaak ingezet om je data te schalen voordat je een model maakt.

In deze oefening gebruik je een functie uit sklearn.preprocessing die in de videoles is geïntroduceerd om de numerieke featurekolommen in de gegevensset loan_data te standaardiseren. Onthoud dat dit de data schaalt zodat de gemiddelde waarde 0 is en de standaardafwijking 1.

De module sklearn.preprocessing is al voor je geïmporteerd.

Pipeline-overzicht:

Machine learning pipeline

Deze oefening maakt deel uit van de cursus

Machine Learning-sollicitatievragen oefenen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Subset features
numeric_cols = ____.____(include=[____.____])
categoric_cols = ____.____(include=[____])
Code bewerken en uitvoeren