ComeçarComece de graça

Otimizando voos com regressão linear

Até agora, você tem usado os hiperparâmetros padrão ao criar seus modelos. Neste exercício, você vai usar a validação cruzada para escolher um conjunto ideal (ou quase ideal) de hiperparâmetros do modelo.

Já foram criados:

  • regression — um objeto " LinearRegression "
  • pipeline — um pipeline com indexador de strings, codificador one-hot, montador de vetores e regressão linear e
  • evaluator — um objeto " RegressionEvaluator ".

Este exercício faz parte do curso

Machine Learning com PySpark

Ver curso

Instruções do exercício

  • Crie um construtor de grade de parâmetros.
  • Adicione grades para “ regression.regParam ” (valores 0,01, 0,1, 1,0 e 10,0) e “ regression.elasticNetParam ” (valores 0,0, 0,5 e 1,0).
  • Construa a grade.
  • Crie um validador cruzado, especificando cinco dobras.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Editar e executar o código