Verbessere dein Modell

Deine Aufgabe in dieser Übung ist es, verschiedene Alphastufen mit den Tfidf Vektoren zu testen, um festzustellen, ob es eine bessere Kombination gibt.

Die Trainings- und Testgruppen wurden erstellt und tfidf_vectorizer, tfidf_train und tfidf_test berechnet.

Diese Übung ist Teil des Kurses

Einführung in die natürliche Sprachverarbeitung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste von Alphas, die du mit np.arange() ausprobieren kannst. Die Werte sollten von 0 bis 1 mit Schritten von 0.1 reichen.

  • Erstelle eine Funktion train_and_predict(), die ein Argument entgegennimmt: alpha. Die Funktion sollte:

    • Richte einen MultinomialNB Klassifikator mit alpha=alpha ein.

    • Passe ihn an die Trainingsdaten an.

    • Berechne Vorhersagen für die Testdaten.

    • Berechne die Trefferquote und gib sie zurück.

  • Verwende eine for -Schleife, um alpha, score und einen Zeilenumbruch dazwischen zu drucken. Benutze deine train_and_predict() Funktion, um die score zu berechnen. Ändert sich die Punktzahl zusammen mit dem Alpha? Was ist das beste Alpha?

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()