Otimização da regressão linear de voos
Até agora, você tem usado os hiperparâmetros padrão ao criar seus modelos. Neste exercício, você usará a validação cruzada para escolher um conjunto ideal (ou próximo do ideal) de hiperparâmetros do modelo.
Os seguintes já foram criados:
regression
- um objetoLinearRegression
pipeline
- um pipeline com indexador de strings, codificador de um ponto, montador de vetores e regressão linear eevaluator
- um objetoRegressionEvaluator
.
Este exercício faz parte do curso
Aprendizado de máquina com PySpark
Instruções de exercício
- Crie um construtor de grade de parâmetros.
- Adicione grades para
regression.regParam
(valores 0,01, 0,1, 1,0 e 10,0) eregression.elasticNetParam
(valores 0,0, 0,5 e 1,0). - Construa a grade.
- Crie um validador cruzado, especificando cinco dobras.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)