Nächste-Nachbarn-Klassifikation: Anpassung
In dieser Übung erstellst du dein erstes Klassifikationsmodell mithilfe des churn_df
-Datensatzes, der Daten zur Kundenabwanderung enthält und für den Rest des Kapitels bereits geladen wurde.
Die Zielvariable, "churn"
, muss eine einzelne Spalte sein und dieselbe Anzahl von Beobachtungen enthalten wie die Merkmalsdaten. Die Merkmalsdaten wurden bereits in numpy
-Arrays umgewandelt.
Die Zeitdauer seit der Kontoeröffnung ("account_length"
) und die Anzahl der Anfragen an den Kundendienst ("customer_service_calls"
) werden als Merkmale genutzt, weil Ersteres auf Kundentreue hindeutet und Letzteres Unzufriedenheit signalisieren könnte – dies sind also potenziell gute Prädiktoren für die Abwanderung.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Importiere
KNeighborsClassifier
aussklearn.neighbors
. - Instanziiere ein
KNeighborsClassifier
-Objekt namensknn
mit6
Nachbarn. - Passe den Klassifikator mit der Methode
.fit()
an die Daten an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import KNeighborsClassifier
from ____.____ import ____
y = churn_df["churn"].values
X = churn_df[["account_length", "customer_service_calls"]].values
# Create a KNN classifier with 6 neighbors
knn = ____(____=____)
# Fit the classifier to the data
knn.____(____, ____)