LoslegenKostenlos loslegen

Dein Modell verbessern

Deine Aufgabe in dieser Übung ist es, einige verschiedene Alpha-Werte mit den Tfidf-Vektoren zu testen, um herauszufinden, ob es eine besser funktionierende Kombination gibt.

Die Trainings- und Test-Sets wurden erstellt, und tfidf_vectorizer, tfidf_train und tfidf_test wurden berechnet.

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste von Alpha-Werten mit np.arange(). Die Werte sollten von 0 bis 1 in Schritten von 0.1 gehen.
  • Erstelle eine Funktion train_and_predict(), die ein Argument entgegennimmt: alpha. Die Funktion soll:
    • Einen MultinomialNB-Klassifikator mit alpha=alpha instanziieren.
    • Ihn auf die Trainingsdaten fitten.
    • Vorhersagen für die Testdaten berechnen.
    • Die Accuracy berechnen und zurückgeben.
  • Gib mithilfe einer for-Schleife alpha, score und eine neue Zeile dazwischen aus. Verwende deine Funktion train_and_predict(), um den score zu berechnen. Ändert sich der Score mit dem Alpha? Welches Alpha ist am besten?

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Code bearbeiten und ausführen