Automatizando a Escolha de Hiperparâmetros
Encontrar o melhor hiperparâmetro de interesse sem escrever centenas de linhas de código para centenas de modelos é um ganho importante de eficiência que vai ajudar muito na construção dos seus futuros modelos de machine learning.
Um hiperparâmetro importante para o algoritmo GBM é a taxa de aprendizado (learning rate). Mas qual learning rate é melhor para este problema? Escrevendo um loop para testar várias possibilidades, consolidar os resultados e visualizá-los, você pode encontrar a melhor.
Learning rates possíveis para testar incluem 0.001, 0.01, 0.05, 0.1, 0.2 e 0.5
Você terá disponíveis os conjuntos X_train, X_test, y_train e y_test, e GradientBoostingClassifier já foi importado para você.
Este exercício faz parte do curso
Ajuste de Hiperparâmetros em Python
Instruções do exercício
- Crie uma lista
learning_ratescom as taxas de aprendizado e umaresults_listpara guardar a acurácia das suas previsões. - Escreva um loop para criar um modelo GBM para cada learning rate mencionada e gerar previsões para cada modelo.
- Salve o learning rate e a acurácia em uma
results_list. - Transforme a lista de resultados em um DataFrame e imprima-o.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the learning rates & results storage
learning_rates = ____
results_list = ____
# Create the for loop to evaluate model predictions for each learning rate
for learning_rate in ____:
model = ____(learning_rate=____)
predictions = ____.fit(____, ____).predict(____)
# Save the learning rate and accuracy score
results_list.append([____, accuracy_score(y_test, ____)])
# Gather everything into a DataFrame
results_df = pd.DataFrame(____, columns=['learning_rate', 'accuracy'])
print(results_df)