Prédire la comestibilité des champignons
Maintenant que vous avez exploré les données, il est temps de construire un premier modèle pour prédire la comestibilité des champignons.
Le jeu de données est disponible sous le nom mushrooms. Comme les variables explicatives et la cible sont toutes deux catégorielles, elles ont été transformées pour vous en variables binaires « dummy ».
Commençons avec Naive Bayes (en utilisant le GaussianNB de scikit-learn) et voyons comment cet algorithme se comporte sur ce problème.
Cet exercice fait partie du cours
Méthodes d’ensemble en Python
Instructions
- Instanciez un classifieur
GaussianNBappeléclf_nb. - Entraînez
clf_nbsur les données d’entraînementX_trainety_train. - Calculez les prédictions sur l’ensemble de test. Ces prédictions serviront à évaluer la performance avec l’accuracy (score de précision).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Instantiate a Naive Bayes classifier
clf_nb = ____
# Fit the model to the training set
____
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the accuracy score
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, pred)))