ComeçarComece de graça

Treinando Naive Bayes com seleção de atributos

Agora você vai executar novamente o modelo de classificação de texto Naive Bayes que rodou no final do Capítulo 3, usando as escolhas de seleção do exercício anterior: as colunas title e category_desc do conjunto de dados volunteer.

Este exercício faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercício

  • Use train_test_split() no vetor de texto filtered_text, nos rótulos y (que são os rótulos de category_desc) e passe o conjunto y para o parâmetro stratify, já que temos uma distribuição de classes desbalanceada.
  • Ajuste o modelo Naive Bayes nb com X_train e y_train.
  • Calcule a acurácia no conjunto de teste de nb.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)
Editar e executar o código