Pipeline'ı oluştur
Artık bir Pipeline oluşturmaya hazırsın!
Pipeline, pyspark.ml modülündeki bir sınıftır ve daha önce oluşturduğun tüm Estimator ve Transformerları bir araya getirir. Böylece aynı modelleme sürecini tek bir basit nesne içinde sararak tekrar tekrar kullanabilirsin. Harika, değil mi?
Bu egzersiz, kursun bir parçasıdır
PySpark Temelleri
Egzersiz talimatları
pyspark.mliçindenPipeline'ı içe aktar.Pipeline()yapıcısınıstagesanahtar argümanıyla çağırarakflights_pipeadlı birPipelineoluştur.stages, verinin pipeline içinde geçmesini istediğin tüm aşamaları tutan bir liste olmalı. Burada bu liste:[dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import Pipeline
from ____ import ____
# Make the pipeline
flights_pipe = Pipeline(stages=____)