Addestrare Naive Bayes con selezione delle caratteristiche
Ora eseguirai di nuovo il modello di classificazione del testo Naive Bayes che hai lanciato alla fine del Capitolo 3, usando le scelte di selezione dell'esercizio precedente: le colonne title e category_desc del dataset volunteer.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Usa
train_test_split()sul vettore testualefiltered_text, sulle etichettey(cioè le etichettecategory_desc), e passa l'insiemeyal parametrostratify, dato che abbiamo una distribuzione di classi sbilanciata. - Adestra il modello Naive Bayes
nbsuX_trainey_train. - Calcola l'accuratezza sul set di test di
nb.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)