Entrenamiento de Naive Bayes con selección de características
Ahora volverás a ejecutar el modelo de clasificación de texto Naive Bayes que ejecutaste al final del Capítulo 3 con nuestras opciones de selección del ejercicio anterior: las columnas title
y category_desc
del conjunto de datos volunteer
.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Utiliza
train_test_split()
en el vector de textofiltered_text
, las etiquetasy
(que son las etiquetascategory_desc
), y pasa el conjuntoy
al parámetrostratify
, ya que tenemos una distribución de clases desigual. - Ajusta el modelo
nb
Naive Bayes aX_train
yy_train
. - Calcula la precisión del conjunto de pruebas de
nb
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)