K-nearest neighbors voor paddenstoelen
De Gaussian Naive Bayes-classifier deed het verrassend goed als startmodel. Laten we nu een nieuw model bouwen om het te vergelijken met Naive Bayes.
In dit geval gebruiken we een 5-nearest neighbors-classifier. Omdat de dummyfeatures een hoog-dimensionale gegevensset opleveren, gebruik je het Ball Tree-algoritme om het model sneller te maken. Kijken hoe dit model presteert!
Deze oefening maakt deel uit van de cursus
Ensemblemethoden in Python
Oefeninstructies
- Bouw een
KNeighborsClassifiermet5neighbors enalgorithm = 'ball_tree'(om de verwerking te versnellen). - Train het model op de trainingsdata.
- Evalueer de prestaties op de testset met de accuracy score.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Instantiate a 5-nearest neighbors classifier with 'ball_tree' algorithm
clf_knn = ____(____, ____)
# Fit the model to the training set
____
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the accuracy score
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, pred)))