Treinamento do Naive Bayes com seleção de recursos
Agora, você executará novamente o modelo de classificação de texto Naive Bayes que foi executado no final do Capítulo 3 com nossas escolhas de seleção do exercício anterior: as colunas title
e category_desc
do conjunto de dados volunteer
.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Use
train_test_split()
no vetor de textofiltered_text
, os rótulosy
(que são os rótuloscategory_desc
) e passe o conjuntoy
para o parâmetrostratify
, já que temos uma distribuição de classe desigual. - Ajuste o modelo
nb
Naive Bayes paraX_train
ey_train
. - Calcule a precisão do conjunto de teste de
nb
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)