Buat pipeline
Sekarang Anda siap membuat sebuah Pipeline!
Pipeline adalah kelas dalam modul pyspark.ml yang menggabungkan semua Estimator dan Transformer yang sudah Anda buat. Ini memungkinkan Anda menggunakan ulang proses pemodelan yang sama berulang kali dengan membungkusnya dalam satu objek sederhana. Keren, bukan?
Latihan ini merupakan bagian dari kursus
Dasar-Dasar PySpark
Instruksi latihan
- Impor
Pipelinedaripyspark.ml. - Panggil konstruktor
Pipeline()dengan argumen kata kuncistagesuntuk membuatPipelinebernamaflights_pipe.stagesharus berupa daftar yang memuat semua tahap yang Anda inginkan untuk dilalui data di dalam pipeline. Di sini hanya:[dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import Pipeline
from ____ import ____
# Make the pipeline
flights_pipe = Pipeline(stages=____)