Crea la pipeline
Finalmente sei prontə a creare una Pipeline!
Pipeline è una classe del modulo pyspark.ml che combina tutti gli Estimators e i Transformers che hai già creato. In questo modo puoi riutilizzare lo stesso processo di modellazione ogni volta, racchiudendolo in un unico oggetto semplice. Niente male, vero?
Questo esercizio fa parte del corso
Fondamenti di PySpark
Istruzioni dell'esercizio
- Importa
Pipelinedapyspark.ml. - Chiama il costruttore
Pipeline()con l'argomento con nomestagesper creare unaPipelinechiamataflights_pipe.stagesdeve essere una lista con tutte le fasi che vuoi che i tuoi dati attraversino nella pipeline. Qui è semplicemente:[dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import Pipeline
from ____ import ____
# Make the pipeline
flights_pipe = Pipeline(stages=____)