MulaiMulai sekarang secara gratis

Buat pipeline

Sekarang Anda siap membuat sebuah Pipeline!

Pipeline adalah kelas dalam modul pyspark.ml yang menggabungkan semua Estimator dan Transformer yang sudah Anda buat. Ini memungkinkan Anda menggunakan ulang proses pemodelan yang sama berulang kali dengan membungkusnya dalam satu objek sederhana. Keren, bukan?

Latihan ini adalah bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Petunjuk latihan

  • Impor Pipeline dari pyspark.ml.
  • Panggil konstruktor Pipeline() dengan argumen kata kunci stages untuk membuat Pipeline bernama flights_pipe.
    • stages harus berupa daftar yang memuat semua tahap yang Anda inginkan untuk dilalui data di dalam pipeline. Di sini hanya: [dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import Pipeline
from ____ import ____

# Make the pipeline
flights_pipe = Pipeline(stages=____)
Edit dan Jalankan Kode