Mejora tu modelo
Tu trabajo en este ejercicio es probar varios valores de alpha usando los vectores Tfidf para ver si hay una combinación que funcione mejor.
Ya se han creado los conjuntos de entrenamiento y prueba, y se han calculado tfidf_vectorizer, tfidf_train y tfidf_test.
Este ejercicio forma parte del curso
Introducción al Natural Language Processing en Python
Instrucciones del ejercicio
- Crea una lista de valores de alpha a probar usando
np.arange(). Los valores deben ir de0a1con pasos de0.1. - Crea una función
train_and_predict()que reciba un argumento:alpha. La función debe:- Instanciar un clasificador
MultinomialNBconalpha=alpha. - Ajustarlo a los datos de entrenamiento.
- Calcular las predicciones sobre los datos de prueba.
- Calcular y devolver la puntuación de exactitud.
- Instanciar un clasificador
- Usando un bucle
for, imprime elalpha, elscorey una línea en blanco entre medias. Usa tu funcióntrain_and_predict()para calcular elscore. ¿Cambia la puntuación a la vez que el alpha? ¿Cuál es el mejor alpha?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()