IniziaInizia gratis

Crea la pipeline

Finalmente sei prontə a creare una Pipeline!

Pipeline è una classe del modulo pyspark.ml che combina tutti gli Estimators e i Transformers che hai già creato. In questo modo puoi riutilizzare lo stesso processo di modellazione ogni volta, racchiudendolo in un unico oggetto semplice. Niente male, vero?

Questo esercizio fa parte del corso

Fondamenti di PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Importa Pipeline da pyspark.ml.
  • Chiama il costruttore Pipeline() con l'argomento con nome stages per creare una Pipeline chiamata flights_pipe.
    • stages deve essere una lista con tutte le fasi che vuoi che i tuoi dati attraversino nella pipeline. Qui è semplicemente: [dest_indexer, dest_encoder, carr_indexer, carr_encoder, vec_assembler]

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import Pipeline
from ____ import ____

# Make the pipeline
flights_pipe = Pipeline(stages=____)
Modifica ed esegui il codice