Aprimorando seu modelo
Sua tarefa neste exercício é testar alguns níveis diferentes de alpha usando os vetores Tfidf para determinar se existe uma combinação com desempenho melhor.
Os conjuntos de treino e teste já foram criados, e tfidf_vectorizer, tfidf_train e tfidf_test já foram calculados.
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em Python
Instruções do exercício
- Crie uma lista de valores de alpha para testar usando
np.arange(). Os valores devem variar de0a1em passos de0.1. - Crie uma função
train_and_predict()que recebe um argumento:alpha. A função deve:- Instanciar um classificador
MultinomialNBcomalpha=alpha. - Ajustá-lo aos dados de treino.
- Calcular as previsões nos dados de teste.
- Calcular e retornar o score de acurácia.
- Instanciar um classificador
- Usando um loop
for, imprima oalpha, oscoree uma linha em branco entre eles. Use sua funçãotrain_and_predict()para calcular oscore. O score muda junto com o alpha? Qual é o melhor alpha?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()