LoslegenKostenlos loslegen

Feature Engineering

Du sollst vorhersagen, ob eine neue Kohorte von Kreditbewerber:innen ihre Kredite voraussichtlich nicht zurückzahlen wird. Dafür hast du einen historischen Datensatz und möchtest darauf einen Klassifikator trainieren. Dir fällt auf, dass viele Features als Strings vorliegen – das ist für deine Klassifikatoren problematisch. Deshalb entscheidest du dich, die String-Spalten numerisch zu kodieren, und zwar mit LabelEncoder(). Die Funktion wurde aus dem preprocessing-Untermodul von sklearn bereits für dich geladen. Der Datensatz credit ist ebenfalls vorab geladen, ebenso eine Liste aller Spaltennamen mit String-Datentypen in non_numeric_columns.

Diese Übung ist Teil des Kurses

Machine-Learning-Workflows in Python entwerfen

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Inspect the first few lines of your data using head()
credit.____
Code bearbeiten und ausführen