Verbessere dein Modell
Deine Aufgabe in dieser Übung ist es, verschiedene Alphastufen mit den Tfidf
Vektoren zu testen, um festzustellen, ob es eine bessere Kombination gibt.
Die Trainings- und Testgruppen wurden erstellt und tfidf_vectorizer
, tfidf_train
und tfidf_test
berechnet.
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Anleitung zur Übung
Erstelle eine Liste von Alphas, die du mit
np.arange()
ausprobieren kannst. Die Werte sollten von0
bis1
mit Schritten von0.1
reichen.Erstelle eine Funktion
train_and_predict()
, die ein Argument entgegennimmt:alpha
. Die Funktion sollte:Richte einen
MultinomialNB
Klassifikator mitalpha=alpha
ein.Passe ihn an die Trainingsdaten an.
Berechne Vorhersagen für die Testdaten.
Berechne die Trefferquote und gib sie zurück.
Verwende eine
for
-Schleife, umalpha
,score
und einen Zeilenumbruch dazwischen zu drucken. Benutze deinetrain_and_predict()
Funktion, um diescore
zu berechnen. Ändert sich die Punktzahl zusammen mit dem Alpha? Was ist das beste Alpha?
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()