KNN op niet-geschaalde data
Voordat je standaardisatie toevoegt aan je scikit-learn-workflow, bekijk je eerst de nauwkeurigheid van een K-nearest neighbors-model op de wine-gegevensset zonder de data te standaardiseren.
Het knn-model en de X- en y-gegevens en labelsets zijn al aangemaakt.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Splits de gegevensset in trainings- en testsets.
- Fit het
knn-model op de trainingsdata. - Print de testnauwkeurigheid van je getrainde
knn-model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)
# Fit the k-nearest neighbors model to the training data
____
# Score the model on the test data
print(____.____(____, ____))