Entrenamiento de Naive Bayes con selección de características
Ahora volverás a ejecutar el modelo de clasificación de texto Naive Bayes que ejecutaste al final del Capítulo 3 con nuestras opciones de selección del ejercicio anterior: las columnas title y category_desc del conjunto de datos volunteer.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones del ejercicio
- Utiliza
train_test_split()en el vector de textofiltered_text, las etiquetasy(que son las etiquetascategory_desc), y pasa el conjuntoyal parámetrostratify, ya que tenemos una distribución de clases desigual. - Ajusta el modelo
nbNaive Bayes aX_trainyy_train. - Calcula la precisión del conjunto de pruebas de
nb.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)