Neste capítulo, você aprenderá como o Spark gerencia os dados e como você pode ler e gravar tabelas no Python.
Neste capítulo, você aprenderá sobre o módulo pyspark.sql, que fornece consultas de dados otimizadas à sua sessão do Spark.
O PySpark tem rotinas de aprendizado de máquina de ponta incorporadas, além de utilitários para criar pipelines completos de aprendizado de máquina. Você aprenderá sobre eles neste capítulo.
Neste último capítulo, você aplicará o que aprendeu para criar um modelo que preveja quais voos sofrerão atrasos.