LoslegenKostenlos loslegen

Spalten binarisieren

Zahlenwerte lassen sich oft ohne Feature Engineering verwenden, aber manchmal ist eine gewisse Anpassung sinnvoll. Manchmal ist z. B. nicht die Höhe eines Werts wichtig, sondern nur seine Richtung – oder ob er überhaupt vorhanden ist. In solchen Fällen möchtest du eine Spalte binarisieren. Im Datensatz so_survey_df gibt es viele Befragte, die freiwillig (ohne Bezahlung) arbeiten. Du erstellst eine neue Spalte namens Paid_Job, die angibt, ob eine Person bezahlt wird (ihr Gehalt ist größer als null).

Diese Übung ist Teil des Kurses

Feature Engineering für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine neue Spalte namens Paid_Job, gefüllt mit Nullen.
  • Ersetze alle Paid_Job-Werte durch 1, wenn der entsprechende ConvertedSalary größer als 0 ist.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Code bearbeiten und ausführen