Comece agoraComece grátis

Treinando Naive Bayes com seleção de atributos

Agora você vai executar novamente o modelo de classificação de texto Naive Bayes que rodou no final do Capítulo 3, usando as escolhas de seleção do exercício anterior: as colunas title e category_desc do conjunto de dados volunteer.

Este exercicio faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercicio

  • Use train_test_split() no vetor de texto filtered_text, nos rótulos y (que são os rótulos de category_desc) e passe o conjunto y para o parâmetro stratify, já que temos uma distribuição de classes desbalanceada.
  • Ajuste o modelo Naive Bayes nb com X_train e y_train.
  • Calcule a acurácia no conjunto de teste de nb.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)
Editar e Executar Código