CommencerCommencer gratuitement

Prédire la comestibilité des champignons

Maintenant que vous avez exploré les données, il est temps de construire un premier modèle pour prédire la comestibilité des champignons.

Le jeu de données est disponible sous le nom mushrooms. Comme les variables explicatives et la cible sont toutes deux catégorielles, elles ont été transformées pour vous en variables binaires « dummy ».

Commençons avec Naive Bayes (en utilisant le GaussianNB de scikit-learn) et voyons comment cet algorithme se comporte sur ce problème.

Cet exercice fait partie du cours

Méthodes d’ensemble en Python

Afficher le cours

Instructions

  • Instanciez un classifieur GaussianNB appelé clf_nb.
  • Entraînez clf_nb sur les données d’entraînement X_train et y_train.
  • Calculez les prédictions sur l’ensemble de test. Ces prédictions serviront à évaluer la performance avec l’accuracy (score de précision).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Instantiate a Naive Bayes classifier
clf_nb = ____

# Fit the model to the training set
____

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the accuracy score
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, pred)))
Modifier et exécuter le code