Spalten binarisieren
Zahlenwerte lassen sich oft ohne Feature Engineering verwenden, aber manchmal ist eine gewisse Anpassung sinnvoll. Manchmal ist z. B. nicht die Höhe eines Werts wichtig, sondern nur seine Richtung – oder ob er überhaupt vorhanden ist. In solchen Fällen möchtest du eine Spalte binarisieren. Im Datensatz so_survey_df gibt es viele Befragte, die freiwillig (ohne Bezahlung) arbeiten. Du erstellst eine neue Spalte namens Paid_Job, die angibt, ob eine Person bezahlt wird (ihr Gehalt ist größer als null).
Diese Übung ist Teil des Kurses
Feature Engineering für Machine Learning in Python
Anleitung zur Übung
- Erstelle eine neue Spalte namens
Paid_Job, gefüllt mit Nullen. - Ersetze alle
Paid_Job-Werte durch 1, wenn der entsprechendeConvertedSalarygrößer als 0 ist.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____
# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1
# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())