In diesem Kapitel lernst du, wie Spark mit Daten umgeht und wie du mit Python Tabellen lesen und schreiben kannst.
In diesem Kapitel lernst du das Modul pyspark.sql kennen, das optimierte Datenabfragen für deine Spark-Sitzung bereitstellt.
PySpark verfügt über integrierte, hochmoderne Machine-Learning-Routinen sowie über Hilfsprogramme zur Erstellung kompletter Machine-Learning-Pipelines. In diesem Kapitel lernst du mehr darüber.
In diesem letzten Kapitel wendest du das Gelernte an, um ein Modell zu erstellen, das vorhersagt, welche Flüge verspätet sein werden.