Transformeer de data
Hoera, je bent nu eindelijk klaar om je data door de Pipeline te sturen die je hebt gemaakt!
Deze oefening maakt deel uit van de cursus
Basis van PySpark
Oefeninstructies
- Maak de DataFrame
piped_datadoor dePipeline-methoden.fit()en.transform()achter elkaar aan te roepen. Beide methoden nemenmodel_dataals enige argument.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit and transform the data
piped_data = flights_pipe.____.____