Je model verbeteren
In deze oefening ga je een paar verschillende alpha-niveaus testen met de Tfidf-vectoren om te bepalen of er een beter presterende combinatie is.
De train- en testsets zijn al aangemaakt en tfidf_vectorizer, tfidf_train en tfidf_test zijn berekend.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in Python
Oefeninstructies
- Maak een lijst met alphas om te proberen met
np.arange(). Waarden moeten lopen van0tot1in stappen van0.1. - Maak een functie
train_and_predict()die één argument aanneemt:alpha. De functie moet:- Een
MultinomialNB-classifier initialiseren metalpha=alpha. - Deze fitten op de trainingsdata.
- Voorspellingen maken op de testdata.
- De accuracyscore berekenen en retourneren.
- Een
- Gebruik een
for-lus om dealpha, descoreen een newline ertussen af te drukken. Gebruik je functietrain_and_predict()om descorete berekenen. Verandert de score mee met de alpha? Wat is de beste alpha?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()