Otimizando voos com regressão linear
Até agora, você tem usado os hiperparâmetros padrão ao criar seus modelos. Neste exercício, você vai usar a validação cruzada para escolher um conjunto ideal (ou quase ideal) de hiperparâmetros do modelo.
Já foram criados:
regression
— um objeto "LinearRegression
"pipeline
— um pipeline com indexador de strings, codificador one-hot, montador de vetores e regressão linear eevaluator
— um objeto "RegressionEvaluator
".
Este exercício faz parte do curso
Machine Learning com PySpark
Instruções do exercício
- Crie um construtor de grade de parâmetros.
- Adicione grades para “
regression.regParam
” (valores 0,01, 0,1, 1,0 e 10,0) e “regression.elasticNetParam
” (valores 0,0, 0,5 e 1,0). - Construa a grade.
- Crie um validador cruzado, especificando cinco dobras.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)