MulaiMulai sekarang secara gratis

Buat sebuah grid

Selanjutnya, Anda perlu membuat grid nilai yang akan ditelusuri saat mencari hyperparameter yang optimal. Submodul pyspark.ml.tuning menyertakan kelas bernama ParamGridBuilder yang melakukan hal tersebut (mungkin Anda mulai melihat polanya; PySpark memiliki submodul untuk hampir semua hal!).

Anda perlu menggunakan metode .addGrid() dan .build() untuk membuat grid yang dapat digunakan untuk validasi silang. Metode .addGrid() menerima parameter model (atribut dari Estimator model, lr, yang Anda buat beberapa latihan lalu) dan daftar nilai yang ingin Anda coba. Metode .build() tidak menerima argumen; metode ini hanya mengembalikan grid yang akan Anda gunakan nanti.

Latihan ini adalah bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Petunjuk latihan

  • Impor submodul pyspark.ml.tuning dengan alias tune.
  • Panggil konstruktor kelas ParamGridBuilder() tanpa argumen. Simpan sebagai grid.
  • Panggil metode .addGrid() pada grid dengan lr.regParam sebagai argumen pertama dan np.arange(0, .1, .01) sebagai argumen kedua. Panggilan kedua ini adalah fungsi dari modul numpy (diimpor as np) yang membuat daftar angka dari 0 hingga .1, bertambah sebesar .01. Timpa grid dengan hasilnya.
  • Perbarui grid lagi dengan memanggil metode .addGrid() untuk kedua kalinya guna membuat grid untuk lr.elasticNetParam yang hanya mencakup nilai [0, 1].
  • Panggil metode .build() pada grid dan timpa dengan keluarannya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the tuning submodule
import ____ as ____

# Create the parameter grid
grid = tune.____

# Add the hyperparameter
grid = grid.addGrid(____, np.arange(0, .1, .01))
grid = grid.addGrid(____, ____)

# Build the grid
grid = grid.build()
Edit dan Jalankan Kode