Target und Features trennen
Um eine Vorhersage zu treffen (in diesem Fall, ob eine Mitarbeiterin oder ein Mitarbeiter das Unternehmen verlässt), musst du den Datensatz in zwei Komponenten aufteilen:
- die abhängige Variable oder den Target, der vorhergesagt werden soll
- die unabhängigen Variablen oder Features, die für die Vorhersage verwendet werden
Deine Aufgabe ist es, target und features zu trennen. Das Target hier ist der Employee Churn, und die Features umfassen alles andere.
Zur Erinnerung: Der Datensatz wurde bereits angepasst, indem kategoriale Variablen encodiert und Dummies erstellt wurden.
pandas wurde bereits als pd importiert.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen
Anleitung zur Übung
- Setze Target und Features:
- Wähle die Spalte der abhängigen Variable (
churn) und setze sie alstarget. .drop()die Spaltechurn, um alles andere alsfeatureszu setzen.
- Wähle die Spalte der abhängigen Variable (
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set the target and features
# Choose the dependent variable column (churn) and set it as target
target = data.____
# Drop column churn and set everything else as features
features = data.____("____",axis=1)