Nächste-Nachbarn-Klassifikation: Anpassung
In dieser Übung erstellst du dein erstes Klassifikationsmodell mithilfe des churn_df-Datensatzes, der Daten zur Kundenabwanderung enthält und für den Rest des Kapitels bereits geladen wurde.
Die Zielvariable, "churn", muss eine einzelne Spalte sein und dieselbe Anzahl von Beobachtungen enthalten wie die Merkmalsdaten. Die Merkmalsdaten wurden bereits in numpy-Arrays umgewandelt.
Die Zeitdauer seit der Kontoeröffnung ("account_length") und die Anzahl der Anfragen an den Kundendienst ("customer_service_calls") werden als Merkmale genutzt, weil Ersteres auf Kundentreue hindeutet und Letzteres Unzufriedenheit signalisieren könnte – dies sind also potenziell gute Prädiktoren für die Abwanderung.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Importiere
KNeighborsClassifieraussklearn.neighbors. - Instanziiere ein
KNeighborsClassifier-Objekt namensknnmit6Nachbarn. - Passe den Klassifikator mit der Methode
.fit()an die Daten an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import KNeighborsClassifier
from ____.____ import ____
y = churn_df["churn"].values
X = churn_df[["account_length", "customer_service_calls"]].values
# Create a KNN classifier with 6 neighbors
knn = ____(____=____)
# Fit the classifier to the data
knn.____(____, ____)