ComeçarComece gratuitamente

Treinamento do Naive Bayes com seleção de recursos

Agora, você executará novamente o modelo de classificação de texto Naive Bayes que foi executado no final do Capítulo 3 com nossas escolhas de seleção do exercício anterior: as colunas title e category_desc do conjunto de dados volunteer.

Este exercício faz parte do curso

Pré-processamento para aprendizado de máquina em Python

Ver Curso

Instruções de exercício

  • Use train_test_split() no vetor de texto filtered_text, os rótulos y (que são os rótulos category_desc ) e passe o conjunto y para o parâmetro stratify, já que temos uma distribuição de classe desigual.
  • Ajuste o modelo nb Naive Bayes para X_train e y_train.
  • Calcule a precisão do conjunto de teste de nb.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)
Editar e executar código