Entrenamiento de Naive Bayes con selección de características

Ahora volverás a ejecutar el modelo de clasificación de texto Naive Bayes que ejecutaste al final del Capítulo 3 con nuestras opciones de selección del ejercicio anterior: las columnas title y category_desc del conjunto de datos volunteer.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones del ejercicio

Utiliza train_test_split() en el vector de texto filtered_text, las etiquetas y (que son las etiquetas category_desc ), y pasa el conjunto y al parámetro stratify, ya que tenemos una distribución de clases desigual.
Ajusta el modelo nb Naive Bayes a X_train y y_train.
Calcula la precisión del conjunto de pruebas de nb.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)

Editar y ejecutar código