Mengoptimalkan regresi linear pada flights
Sejauh ini Anda menggunakan hiperparameter bawaan saat membangun model. Pada latihan ini Anda akan menggunakan cross validation untuk memilih serangkaian hiperparameter model yang optimal (atau mendekati optimal).
Objek berikut sudah disiapkan:
regression— sebuah objekLinearRegressionpipeline— sebuah pipeline dengan string indexer, one-hot encoder, vector assembler, dan linear regression, sertaevaluator— sebuah objekRegressionEvaluator.
Latihan ini adalah bagian dari kursus
Machine Learning dengan PySpark
Petunjuk latihan
- Buat parameter grid builder.
- Tambahkan grid untuk
regression.regParam(nilai 0,01; 0,1; 1,0; dan 10,0) sertaregression.elasticNetParam(nilai 0,0; 0,5; dan 1,0). - Bangun grid.
- Buat cross validator dengan lima lipatan (five folds).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)