Naive Bayes mit Feature-Auswahl trainieren
Du führst jetzt das Naive-Bayes-Modell zur Textklassifikation, das du am Ende von Kapitel 3 verwendet hast, erneut aus – diesmal mit unserer Auswahl aus der vorherigen Übung: den Spalten title und category_desc des volunteer-Datensatzes.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Verwende
train_test_split()auf dem Textvektorfiltered_text, deny-Labels (das sind diecategory_desc-Labels) und übergib diey-Menge an den Parameterstratify, da wir eine unausgewogene Klassenverteilung haben. - Fitte das Naive-Bayes-Modell
nbaufX_trainundy_train. - Berechne die Testgenauigkeit von
nb.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)