In diesem Kapitel lernst du, wie Spark Daten verwaltet und wie du mit Python Tabellen lesen und schreiben kannst.
In diesem Kapitel lernst du das Modul pyspark.sql kennen, das optimierte Datenabfragen für deine Spark-Sitzung bereitstellt.
PySpark verfügt über integrierte, hochmoderne Routinen für maschinelles Lernen sowie über Hilfsprogramme zur Erstellung kompletter Pipelines für maschinelles Lernen. Du wirst sie in diesem Kapitel kennenlernen.
In diesem letzten Kapitel wendest du das Gelernte an, um ein Modell zu erstellen, das vorhersagt, welche Flüge verspätet sein werden.