Den Baum auf Mitarbeiterdaten fitten
Ein Train/Test-Split bietet die Möglichkeit, den Klassifikator auf dem Trainingsanteil zu entwickeln und ihn auf dem restlichen Datensatz zu testen. In dieser Übung beginnst du mit der Entwicklung eines Vorhersagemodells für Mitarbeiterfluktuation mithilfe des Klassifikationsalgorithmus Decision Tree. Der Algorithmus stellt eine Methode .fit() bereit, mit der du im Trainingssatz die Features an das Modell anpassen kannst.
Zur Erinnerung: Sowohl Zielvariable als auch Features sind bereits in Train- und Test-Anteile aufgeteilt (Train: features_train, target_train, Test: features_test, target_test).
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen
Anleitung zur Übung
- Importiere den Klassifikationsalgorithmus
DecisionTreeClassifier. - Initialisiere ihn als
modelund setze den Zufallszustand auf 42. - Wende das Decision-Tree-Modell an, indem du die Trainings-Features an das
modelfitstest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the classification algorithm
from sklearn.tree import ____
# Initialize it and call model by specifying the random_state parameter
model = ____(random_state=42)
# Apply a decision tree model to fit features to the target
model.____(features_train, ____)