Buat pipeline
Sekarang Anda siap membuat sebuah Pipeline!
Pipeline adalah kelas dalam modul pyspark.ml yang menggabungkan semua Estimator dan Transformer yang sudah Anda buat. Ini memungkinkan Anda menggunakan ulang proses pemodelan yang sama berulang kali dengan membungkusnya dalam satu objek sederhana. Keren, bukan?
Latihan ini adalah bagian dari kursus
Dasar-Dasar PySpark
Petunjuk latihan
- Impor
Pipelinedaripyspark.ml. - Panggil konstruktor
Pipeline()dengan argumen kata kuncistagesuntuk membuatPipelinebernamaflights_pipe.stagesharus berupa daftar yang memuat semua tahap yang Anda inginkan untuk dilalui data di dalam pipeline. Di sini hanya:[dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import Pipeline
from ____ import ____
# Make the pipeline
flights_pipe = Pipeline(stages=____)