ComeçarComece de graça

Aprimorando seu modelo

Sua tarefa neste exercício é testar alguns níveis diferentes de alpha usando os vetores Tfidf para determinar se existe uma combinação com desempenho melhor.

Os conjuntos de treino e teste já foram criados, e tfidf_vectorizer, tfidf_train e tfidf_test já foram calculados.

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em Python

Ver curso

Instruções do exercício

  • Crie uma lista de valores de alpha para testar usando np.arange(). Os valores devem variar de 0 a 1 em passos de 0.1.
  • Crie uma função train_and_predict() que recebe um argumento: alpha. A função deve:
    • Instanciar um classificador MultinomialNB com alpha=alpha.
    • Ajustá-lo aos dados de treino.
    • Calcular as previsões nos dados de teste.
    • Calcular e retornar o score de acurácia.
  • Usando um loop for, imprima o alpha, o score e uma linha em branco entre eles. Use sua função train_and_predict() para calcular o score. O score muda junto com o alpha? Qual é o melhor alpha?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Editar e executar o código