Dein Modell verbessern
Deine Aufgabe in dieser Übung ist es, einige verschiedene Alpha-Werte mit den Tfidf-Vektoren zu testen, um herauszufinden, ob es eine besser funktionierende Kombination gibt.
Die Trainings- und Test-Sets wurden erstellt, und tfidf_vectorizer, tfidf_train und tfidf_test wurden berechnet.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit Python
Anleitung zur Übung
- Erstelle eine Liste von Alpha-Werten mit
np.arange(). Die Werte sollten von0bis1in Schritten von0.1gehen. - Erstelle eine Funktion
train_and_predict(), die ein Argument entgegennimmt:alpha. Die Funktion soll:- Einen
MultinomialNB-Klassifikator mitalpha=alphainstanziieren. - Ihn auf die Trainingsdaten fitten.
- Vorhersagen für die Testdaten berechnen.
- Die Accuracy berechnen und zurückgeben.
- Einen
- Gib mithilfe einer
for-Schleifealpha,scoreund eine neue Zeile dazwischen aus. Verwende deine Funktiontrain_and_predict(), um denscorezu berechnen. Ändert sich der Score mit dem Alpha? Welches Alpha ist am besten?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()