En este capítulo, aprenderás cómo gestiona Spark los datos y cómo leer y escribir tablas desde Python.
En este capítulo, aprenderás sobre el módulo pyspark.sql, que proporciona consultas de datos optimizadas a tu sesión Spark.
PySpark tiene rutinas de machine learning de última generación integradas, junto con utilidades para crear pipelines completos de machine learning. Aprenderás todo esto en este capítulo.
En este último capítulo, aplicarás lo que has aprendido para crear un modelo que prevea qué vuelos sufrirán retrasos.