Pipeline'ı oluştur
Artık bir Pipeline oluşturmaya hazırsın!
Pipeline, pyspark.ml modülündeki bir sınıftır ve daha önce oluşturduğun tüm Estimator ve Transformerları bir araya getirir. Böylece aynı modelleme sürecini tek bir basit nesne içinde sararak tekrar tekrar kullanabilirsin. Harika, değil mi?
Bu egzersiz
PySpark Temelleri
kursunun bir parçasıdırEgzersiz talimatları
pyspark.mliçindenPipeline'ı içe aktar.Pipeline()yapıcısınıstagesanahtar argümanıyla çağırarakflights_pipeadlı birPipelineoluştur.stages, verinin pipeline içinde geçmesini istediğin tüm aşamaları tutan bir liste olmalı. Burada bu liste:[dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import Pipeline
from ____ import ____
# Make the pipeline
flights_pipe = Pipeline(stages=____)