ComeçarComece gratuitamente

Ajuste o(s) modelo(s)

Finalmente você está pronto para ajustar os modelos e selecionar o melhor!

Infelizmente, a validação cruzada é um procedimento que consome muitos recursos de computação. O ajuste de todos os modelos levaria muito tempo no DataCamp.

Para fazer isso localmente, você deve usar o código:

# Fit cross validation models
models = cv.fit(training)

# Extract the best model
best_lr = models.bestModel

Lembre-se: os dados de treinamento são chamados de training, e você está usando lr para ajustar um modelo de regressão logística. A validação cruzada selecionou os valores dos parâmetros regParam=0 e elasticNetParam=0 como sendo os melhores. Esses são os valores-padrão, portanto você não precisa fazer mais nada com lr antes de ajustar o modelo.

Este exercício faz parte do curso

Introdução ao PySpark

Ver Curso

Instruções de exercício

  • Crie best_lr chamando lr.fit() com os dados de treinamento (training).
  • Imprima best_lr para verificar se ele é um objeto da classe LogisticRegressionModel.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Call lr.fit()
best_lr = ____

# Print best_lr
print(____)
Editar e executar código