MulaiMulai sekarang secara gratis

Mengoptimalkan regresi linear pada flights

Sejauh ini Anda menggunakan hiperparameter bawaan saat membangun model. Pada latihan ini Anda akan menggunakan cross validation untuk memilih serangkaian hiperparameter model yang optimal (atau mendekati optimal).

Objek berikut sudah disiapkan:

  • regression — sebuah objek LinearRegression
  • pipeline — sebuah pipeline dengan string indexer, one-hot encoder, vector assembler, dan linear regression, serta
  • evaluator — sebuah objek RegressionEvaluator.

Latihan ini adalah bagian dari kursus

Machine Learning dengan PySpark

Lihat Kursus

Petunjuk latihan

  • Buat parameter grid builder.
  • Tambahkan grid untuk regression.regParam (nilai 0,01; 0,1; 1,0; dan 10,0) serta regression.elasticNetParam (nilai 0,0; 0,5; dan 1,0).
  • Bangun grid.
  • Buat cross validator dengan lima lipatan (five folds).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Edit dan Jalankan Kode