Z-score-standardisatie
In de vorige oefening heb je de Z-score berekend om uitbijters aan te pakken. In een Machine Learning-sollicitatiegesprek kan ook worden gevraagd waar Z-scores nog meer voor worden gebruikt. Ze worden vaak ingezet om je data te schalen voordat je een model maakt.
In deze oefening gebruik je een functie uit sklearn.preprocessing die in de videoles is geïntroduceerd om de numerieke featurekolommen in de gegevensset loan_data te standaardiseren. Onthoud dat dit de data schaalt zodat de gemiddelde waarde 0 is en de standaardafwijking 1.
De module sklearn.preprocessing is al voor je geïmporteerd.
Pipeline-overzicht:

Deze oefening maakt deel uit van de cursus
Machine Learning-sollicitatievragen oefenen in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Subset features
numeric_cols = ____.____(include=[____.____])
categoric_cols = ____.____(include=[____])