MulaiMulai sekarang secara gratis

Latih model

Sekarang Anda siap melatih model dan memilih yang terbaik!

Sayangnya, cross validation adalah prosedur yang sangat intensif komputasi. Melatih semua model akan memakan waktu terlalu lama di DataCamp.

Untuk melakukannya secara lokal Anda akan menggunakan kode:

# Fit cross validation models
models = cv.fit(training)

# Extract the best model
best_lr = models.bestModel

Ingat, himpunan data pelatihan bernama training dan Anda menggunakan lr untuk melatih model logistic regression. Cross validation memilih nilai parameter regParam=0 dan elasticNetParam=0 sebagai yang terbaik. Ini adalah nilai bawaan, jadi Anda tidak perlu melakukan apa pun lagi pada lr sebelum melatih model.

Latihan ini adalah bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Petunjuk latihan

  • Buat best_lr dengan memanggil lr.fit() pada data training.
  • Cetak best_lr untuk memastikan bahwa objek tersebut bertipe kelas LogisticRegressionModel.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Call lr.fit()
best_lr = ____

# Print best_lr
print(____)
Edit dan Jalankan Kode