Dans ce chapitre, vous apprendrez comment Spark gère les données et comment vous pouvez lire et écrire des tableaux depuis Python.
Dans ce chapitre, vous découvrirez le module pyspark.sql, qui fournit des requêtes de données optimisées à votre session Spark.
PySpark intègre des routines d'apprentissage automatique de pointe, ainsi que des utilitaires permettant de créer des pipelines d'apprentissage automatique complets. Vous les découvrirez dans ce chapitre.
Dans ce dernier chapitre, vous appliquerez ce que vous avez appris pour créer un modèle qui prédit les vols qui seront retardés.