Aan de slagGa gratis aan de slag

Eetbaarheid van paddenstoelen voorspellen

Nu je de data hebt verkend, is het tijd om een eerste model te bouwen om de eetbaarheid van paddenstoelen te voorspellen.

De gegevensset is beschikbaar als mushrooms. Omdat zowel de features als het doel (target) categorisch zijn, zijn deze voor je omgezet naar binaire "dummy"-variabelen.

Laten we beginnen met Naive Bayes (met scikit-learn's GaussianNB) en kijken hoe dit algoritme het op dit probleem doet.

Deze oefening maakt deel uit van de cursus

Ensemblemethoden in Python

Cursus bekijken

Oefeninstructies

  • Instantieer een GaussianNB-classifier met de naam clf_nb.
  • Fit clf_nb op de trainingsdata X_train en y_train.
  • Bereken de voorspellingen op de testset. Deze voorspellingen worden gebruikt om de prestatie te evalueren met de accuracy-score.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Instantiate a Naive Bayes classifier
clf_nb = ____

# Fit the model to the training set
____

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the accuracy score
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, pred)))
Code bewerken en uitvoeren