Addestrare Naive Bayes con selezione delle caratteristiche

Ora eseguirai di nuovo il modello di classificazione del testo Naive Bayes che hai lanciato alla fine del Capitolo 3, usando le scelte di selezione dell'esercizio precedente: le colonne title e category_desc del dataset volunteer.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza corso

Istruzioni dell'esercizio

Usa train_test_split() sul vettore testuale filtered_text, sulle etichette y (cioè le etichette category_desc), e passa l'insieme y al parametro stratify, dato che abbiamo una distribuzione di classi sbilanciata.
Adestra il modello Naive Bayes nb su X_train e y_train.
Calcola l'accuratezza sul set di test di nb.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)

Modifica ed esegui il codice