Ajuste o(s) modelo(s)
Finalmente você está pronto para ajustar os modelos e selecionar o melhor!
Infelizmente, a validação cruzada é um procedimento que consome muitos recursos de computação. O ajuste de todos os modelos levaria muito tempo no DataCamp.
Para fazer isso localmente, você deve usar o código:
# Fit cross validation models
models = cv.fit(training)
# Extract the best model
best_lr = models.bestModel
Lembre-se: os dados de treinamento são chamados de training
, e você está usando lr
para ajustar um modelo de regressão logística. A validação cruzada selecionou os valores dos parâmetros regParam=0
e elasticNetParam=0
como sendo os melhores. Esses são os valores-padrão, portanto você não precisa fazer mais nada com lr
antes de ajustar o modelo.
Este exercício faz parte do curso
Introdução ao PySpark
Instruções de exercício
- Crie
best_lr
chamandolr.fit()
com os dados de treinamento (training
). - Imprima
best_lr
para verificar se ele é um objeto da classeLogisticRegressionModel
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Call lr.fit()
best_lr = ____
# Print best_lr
print(____)