Eetbaarheid van paddenstoelen voorspellen
Nu je de data hebt verkend, is het tijd om een eerste model te bouwen om de eetbaarheid van paddenstoelen te voorspellen.
De gegevensset is beschikbaar als mushrooms. Omdat zowel de features als het doel (target) categorisch zijn, zijn deze voor je omgezet naar binaire "dummy"-variabelen.
Laten we beginnen met Naive Bayes (met scikit-learn's GaussianNB) en kijken hoe dit algoritme het op dit probleem doet.
Deze oefening maakt deel uit van de cursus
Ensemblemethoden in Python
Oefeninstructies
- Instantieer een
GaussianNB-classifier met de naamclf_nb. - Fit
clf_nbop de trainingsdataX_traineny_train. - Bereken de voorspellingen op de testset. Deze voorspellingen worden gebruikt om de prestatie te evalueren met de accuracy-score.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Instantiate a Naive Bayes classifier
clf_nb = ____
# Fit the model to the training set
____
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the accuracy score
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, pred)))