LoslegenKostenlos loslegen

Verbessere dein Modell

Deine Aufgabe in dieser Übung ist es, verschiedene Alphastufen mit den Tfidf Vektoren zu testen, um festzustellen, ob es eine bessere Kombination gibt.

Die Trainings- und Testgruppen wurden erstellt und tfidf_vectorizer, tfidf_train und tfidf_test berechnet.

Diese Übung ist Teil des Kurses

Einführung in die natürliche Sprachverarbeitung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste von Alphas, die du mit np.arange() ausprobieren kannst. Die Werte sollten von 0 bis 1 mit Schritten von 0.1 reichen.

  • Erstelle eine Funktion train_and_predict(), die ein Argument entgegennimmt: alpha. Die Funktion sollte:

    • Richte einen MultinomialNB Klassifikator mit alpha=alpha ein.

    • Passe ihn an die Trainingsdaten an.

    • Berechne Vorhersagen für die Testdaten.

    • Berechne die Trefferquote und gib sie zurück.

  • Verwende eine for -Schleife, um alpha, score und einen Zeilenumbruch dazwischen zu drucken. Benutze deine train_and_predict() Funktion, um die score zu berechnen. Ändert sich die Punktzahl zusammen mit dem Alpha? Was ist das beste Alpha?

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Code bearbeiten und ausführen