Verbessere dein Modell
Deine Aufgabe in dieser Übung ist es, verschiedene Alphastufen mit den Tfidf Vektoren zu testen, um festzustellen, ob es eine bessere Kombination gibt.
Die Trainings- und Testgruppen wurden erstellt und tfidf_vectorizer, tfidf_train und tfidf_test berechnet.
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Anleitung zur Übung
Erstelle eine Liste von Alphas, die du mit
np.arange()ausprobieren kannst. Die Werte sollten von0bis1mit Schritten von0.1reichen.Erstelle eine Funktion
train_and_predict(), die ein Argument entgegennimmt:alpha. Die Funktion sollte:Richte einen
MultinomialNBKlassifikator mitalpha=alphaein.Passe ihn an die Trainingsdaten an.
Berechne Vorhersagen für die Testdaten.
Berechne die Trefferquote und gib sie zurück.
Verwende eine
for-Schleife, umalpha,scoreund einen Zeilenumbruch dazwischen zu drucken. Benutze deinetrain_and_predict()Funktion, um diescorezu berechnen. Ändert sich die Punktzahl zusammen mit dem Alpha? Was ist das beste Alpha?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()