CommencerCommencer gratuitement

Améliorer votre modèle

Votre tâche dans cet exercice est de tester quelques niveaux alpha différents en utilisant les vecteurs Tfidf pour déterminer s'il existe une combinaison plus performante.

Les ensembles de formation et de test ont été créés, et tfidf_vectorizer, tfidf_train, et tfidf_test ont été calculés.

Cet exercice fait partie du cours

Introduction au traitement du langage naturel en Python

Afficher le cours

Instructions

  • Créez une liste d'alphas à essayer en utilisant np.arange(). Les valeurs doivent être comprises entre 0 et 1 avec des étapes de 0.1.

  • Créez une fonction train_and_predict() qui prend un argument : alpha. La fonction doit :

    • Instanciez un classificateur MultinomialNB avec alpha=alpha.

    • Ajustez-le aux données d'apprentissage.

    • Calculez des prédictions sur les données d'essai.

    • Calculez et renvoyez le score de précision.

  • En utilisant une boucle for, imprimez alpha, score et une nouvelle ligne entre les deux. Utilisez votre fonction train_and_predict() pour calculer score. Le score évolue-t-il en même temps que l'alpha ? Quel est le meilleur alpha ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Modifier et exécuter le code