LoslegenKostenlos starten

Spalten binarisieren

Zahlenwerte lassen sich oft ohne Feature Engineering verwenden, aber manchmal ist eine gewisse Anpassung sinnvoll. Manchmal ist z. B. nicht die Höhe eines Werts wichtig, sondern nur seine Richtung – oder ob er überhaupt vorhanden ist. In solchen Fällen möchtest du eine Spalte binarisieren. Im Datensatz so_survey_df gibt es viele Befragte, die freiwillig (ohne Bezahlung) arbeiten. Du erstellst eine neue Spalte namens Paid_Job, die angibt, ob eine Person bezahlt wird (ihr Gehalt ist größer als null).

Diese Übung ist Teil des Kurses

<Kurs>Feature Engineering für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle eine neue Spalte namens Paid_Job, gefüllt mit Nullen.
  • Ersetze alle Paid_Job-Werte durch 1, wenn der entsprechende ConvertedSalary größer als 0 ist.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Code bearbeiten und ausführen