Aan de slagBegin gratis

Eetbaarheid van paddenstoelen voorspellen

Nu je de data hebt verkend, is het tijd om een eerste model te bouwen om de eetbaarheid van paddenstoelen te voorspellen.

De gegevensset is beschikbaar als mushrooms. Omdat zowel de features als het doel (target) categorisch zijn, zijn deze voor je omgezet naar binaire "dummy"-variabelen.

Laten we beginnen met Naive Bayes (met scikit-learn's GaussianNB) en kijken hoe dit algoritme het op dit probleem doet.

Deze oefening maakt deel uit van de cursus

Ensemblemethoden in Python

Bekijk cursus

Oefeninstructies

  • Instantieer een GaussianNB-classifier met de naam clf_nb.
  • Fit clf_nb op de trainingsdata X_train en y_train.
  • Bereken de voorspellingen op de testset. Deze voorspellingen worden gebruikt om de prestatie te evalueren met de accuracy-score.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Instantiate a Naive Bayes classifier
clf_nb = ____

# Fit the model to the training set
____

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the accuracy score
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, pred)))
Code bewerken en uitvoeren