Aan de slagGa gratis aan de slag

KNN op niet-geschaalde data

Voordat je standaardisatie toevoegt aan je scikit-learn-workflow, bekijk je eerst de nauwkeurigheid van een K-nearest neighbors-model op de wine-gegevensset zonder de data te standaardiseren.

Het knn-model en de X- en y-gegevens en labelsets zijn al aangemaakt.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Splits de gegevensset in trainings- en testsets.
  • Fit het knn-model op de trainingsdata.
  • Print de testnauwkeurigheid van je getrainde knn-model.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)

# Fit the k-nearest neighbors model to the training data
____

# Score the model on the test data
print(____.____(____, ____))
Code bewerken en uitvoeren