Treinamento do Naive Bayes com seleção de recursos
Agora, você executará novamente o modelo de classificação de texto Naive Bayes que foi executado no final do Capítulo 3 com nossas escolhas de seleção do exercício anterior: as colunas title e category_desc do conjunto de dados volunteer.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Use
train_test_split()no vetor de textofiltered_text, os rótulosy(que são os rótuloscategory_desc) e passe o conjuntoypara o parâmetrostratify, já que temos uma distribuição de classe desigual. - Ajuste o modelo
nbNaive Bayes paraX_trainey_train. - Calcule a precisão do conjunto de teste de
nb.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)