Améliorer votre modèle
Votre tâche dans cet exercice est de tester quelques niveaux alpha différents en utilisant les vecteurs Tfidf
pour déterminer s'il existe une combinaison plus performante.
Les ensembles de formation et de test ont été créés, et tfidf_vectorizer
, tfidf_train
, et tfidf_test
ont été calculés.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
Créez une liste d'alphas à essayer en utilisant
np.arange()
. Les valeurs doivent être comprises entre0
et1
avec des étapes de0.1
.Créez une fonction
train_and_predict()
qui prend un argument :alpha
. La fonction doit :Instanciez un classificateur
MultinomialNB
avecalpha=alpha
.Ajustez-le aux données d'apprentissage.
Calculez des prédictions sur les données d'essai.
Calculez et renvoyez le score de précision.
En utilisant une boucle
for
, imprimezalpha
,score
et une nouvelle ligne entre les deux. Utilisez votre fonctiontrain_and_predict()
pour calculerscore
. Le score évolue-t-il en même temps que l'alpha ? Quel est le meilleur alpha ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()