Treinando Naive Bayes com seleção de atributos
Agora você vai executar novamente o modelo de classificação de texto Naive Bayes que rodou no final do Capítulo 3, usando as escolhas de seleção do exercício anterior: as colunas title e category_desc do conjunto de dados volunteer.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Use
train_test_split()no vetor de textofiltered_text, nos rótulosy(que são os rótulos decategory_desc) e passe o conjuntoypara o parâmetrostratify, já que temos uma distribuição de classes desbalanceada. - Ajuste o modelo Naive Bayes
nbcomX_trainey_train. - Calcule a acurácia no conjunto de teste de
nb.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)