Mulai sekarangMulai gratis

Latih model

Sekarang Anda siap melatih model dan memilih yang terbaik!

Sayangnya, cross validation adalah prosedur yang sangat intensif komputasi. Melatih semua model akan memakan waktu terlalu lama di DataCamp.

Untuk melakukannya secara lokal Anda akan menggunakan kode:

# Fit cross validation models
models = cv.fit(training)

# Extract the best model
best_lr = models.bestModel

Ingat, himpunan data pelatihan bernama training dan Anda menggunakan lr untuk melatih model logistic regression. Cross validation memilih nilai parameter regParam=0 dan elasticNetParam=0 sebagai yang terbaik. Ini adalah nilai bawaan, jadi Anda tidak perlu melakukan apa pun lagi pada lr sebelum melatih model.

Latihan ini merupakan bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Instruksi latihan

  • Buat best_lr dengan memanggil lr.fit() pada data training.
  • Cetak best_lr untuk memastikan bahwa objek tersebut bertipe kelas LogisticRegressionModel.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Call lr.fit()
best_lr = ____

# Print best_lr
print(____)
Edit dan Jalankan Kode