Améliorer votre modèle
Votre tâche dans cet exercice est de tester quelques niveaux alpha différents en utilisant les vecteurs Tfidf pour déterminer s'il existe une combinaison plus performante.
Les ensembles de formation et de test ont été créés, et tfidf_vectorizer, tfidf_train, et tfidf_test ont été calculés.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
Créez une liste d'alphas à essayer en utilisant
np.arange(). Les valeurs doivent être comprises entre0et1avec des étapes de0.1.Créez une fonction
train_and_predict()qui prend un argument :alpha. La fonction doit :Instanciez un classificateur
MultinomialNBavecalpha=alpha.Ajustez-le aux données d'apprentissage.
Calculez des prédictions sur les données d'essai.
Calculez et renvoyez le score de précision.
En utilisant une boucle
for, imprimezalpha,scoreet une nouvelle ligne entre les deux. Utilisez votre fonctiontrain_and_predict()pour calculerscore. Le score évolue-t-il en même temps que l'alpha ? Quel est le meilleur alpha ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()