KNN op niet-geschaalde data

Voordat je standaardisatie toevoegt aan je scikit-learn-workflow, bekijk je eerst de nauwkeurigheid van een K-nearest neighbors-model op de wine-gegevensset zonder de data te standaardiseren.

Het knn-model en de X- en y-gegevens en labelsets zijn al aangemaakt.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Bekijk cursus

Oefeninstructies

Splits de gegevensset in trainings- en testsets.
Fit het knn-model op de trainingsdata.
Print de testnauwkeurigheid van je getrainde knn-model.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)

# Fit the k-nearest neighbors model to the training data
____

# Score the model on the test data
print(____.____(____, ____))

Code bewerken en uitvoeren