Aan de slagGa gratis aan de slag

Je model verbeteren

In deze oefening ga je een paar verschillende alpha-niveaus testen met de Tfidf-vectoren om te bepalen of er een beter presterende combinatie is.

De train- en testsets zijn al aangemaakt en tfidf_vectorizer, tfidf_train en tfidf_test zijn berekend.

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in Python

Cursus bekijken

Oefeninstructies

  • Maak een lijst met alphas om te proberen met np.arange(). Waarden moeten lopen van 0 tot 1 in stappen van 0.1.
  • Maak een functie train_and_predict() die één argument aanneemt: alpha. De functie moet:
    • Een MultinomialNB-classifier initialiseren met alpha=alpha.
    • Deze fitten op de trainingsdata.
    • Voorspellingen maken op de testdata.
    • De accuracyscore berekenen en retourneren.
  • Gebruik een for-lus om de alpha, de score en een newline ertussen af te drukken. Gebruik je functie train_and_predict() om de score te berekenen. Verandert de score mee met de alpha? Wat is de beste alpha?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Code bewerken en uitvoeren