LoslegenKostenlos starten

Naive Bayes mit Feature-Auswahl trainieren

Du führst jetzt das Naive-Bayes-Modell zur Textklassifikation, das du am Ende von Kapitel 3 verwendet hast, erneut aus – diesmal mit unserer Auswahl aus der vorherigen Übung: den Spalten title und category_desc des volunteer-Datensatzes.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Verwende train_test_split() auf dem Textvektor filtered_text, den y-Labels (das sind die category_desc-Labels) und übergib die y-Menge an den Parameter stratify, da wir eine unausgewogene Klassenverteilung haben.
  • Fitte das Naive-Bayes-Modell nb auf X_train und y_train.
  • Berechne die Testgenauigkeit von nb.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)
Code bearbeiten und ausführen