Latih model
Sekarang Anda siap melatih model dan memilih yang terbaik!
Sayangnya, cross validation adalah prosedur yang sangat intensif komputasi. Melatih semua model akan memakan waktu terlalu lama di DataCamp.
Untuk melakukannya secara lokal Anda akan menggunakan kode:
# Fit cross validation models
models = cv.fit(training)
# Extract the best model
best_lr = models.bestModel
Ingat, himpunan data pelatihan bernama training dan Anda menggunakan lr untuk melatih model logistic regression. Cross validation memilih nilai parameter regParam=0 dan elasticNetParam=0 sebagai yang terbaik. Ini adalah nilai bawaan, jadi Anda tidak perlu melakukan apa pun lagi pada lr sebelum melatih model.
Latihan ini adalah bagian dari kursus
Dasar-Dasar PySpark
Petunjuk latihan
- Buat
best_lrdengan memanggillr.fit()pada datatraining. - Cetak
best_lruntuk memastikan bahwa objek tersebut bertipe kelasLogisticRegressionModel.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Call lr.fit()
best_lr = ____
# Print best_lr
print(____)