Feature Engineering
Du sollst vorhersagen, ob eine neue Kohorte von Kreditbewerber:innen ihre Kredite voraussichtlich nicht zurückzahlen wird. Dafür hast du einen historischen Datensatz und möchtest darauf einen Klassifikator trainieren. Dir fällt auf, dass viele Features als Strings vorliegen – das ist für deine Klassifikatoren problematisch. Deshalb entscheidest du dich, die String-Spalten numerisch zu kodieren, und zwar mit LabelEncoder(). Die Funktion wurde aus dem preprocessing-Untermodul von sklearn bereits für dich geladen. Der Datensatz credit ist ebenfalls vorab geladen, ebenso eine Liste aller Spaltennamen mit String-Datentypen in non_numeric_columns.
Diese Übung ist Teil des Kurses
Machine-Learning-Workflows in Python entwerfen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Inspect the first few lines of your data using head()
credit.____