Aan de slagGa gratis aan de slag

Feature engineering

Je gaat voorspellen of een nieuwe lichting kredietaanvragers waarschijnlijk in gebreke blijft op hun lening. Je hebt een historische gegevensset en wilt daar een classifier op trainen. Je merkt dat veel features als string zijn opgeslagen, wat een probleem is voor je classifiers. Daarom besluit je de string-kolommen numeriek te coderen met LabelEncoder(). De functie is alvast voor je ingeladen uit de submodule preprocessing van sklearn. De gegevensset credit is ook ingeladen, net als een lijst met alle kolomnamen waarvan het datatype string is, opgeslagen in non_numeric_columns.

Deze oefening maakt deel uit van de cursus

Machine Learning-workflows ontwerpen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Inspect the first few lines of your data using head()
credit.____
Code bewerken en uitvoeren