ComenzarEmpieza gratis

Mejora tu modelo

Tu trabajo en este ejercicio es probar varios valores de alpha usando los vectores Tfidf para ver si hay una combinación que funcione mejor.

Ya se han creado los conjuntos de entrenamiento y prueba, y se han calculado tfidf_vectorizer, tfidf_train y tfidf_test.

Este ejercicio forma parte del curso

Introducción al Natural Language Processing en Python

Ver curso

Instrucciones del ejercicio

  • Crea una lista de valores de alpha a probar usando np.arange(). Los valores deben ir de 0 a 1 con pasos de 0.1.
  • Crea una función train_and_predict() que reciba un argumento: alpha. La función debe:
    • Instanciar un clasificador MultinomialNB con alpha=alpha.
    • Ajustarlo a los datos de entrenamiento.
    • Calcular las predicciones sobre los datos de prueba.
    • Calcular y devolver la puntuación de exactitud.
  • Usando un bucle for, imprime el alpha, el score y una línea en blanco entre medias. Usa tu función train_and_predict() para calcular el score. ¿Cambia la puntuación a la vez que el alpha? ¿Cuál es el mejor alpha?

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Editar y ejecutar código