Daten transformieren
Hurra, jetzt bist du endlich bereit, deine Daten durch die von dir erstellte Pipeline
zu leiten!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Erstelle den DataFrame
piped_data
, indem du die MethodenPipeline
.fit()
und.transform()
in einer Kette aufrufst. Beide Methoden benötigenmodel_data
als einziges Argument.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Fit and transform the data
piped_data = flights_pipe.____.____