Neste capítulo, você aprenderá como o Spark gerencia os dados e como você pode ler e gravar tabelas no Python.
Neste capítulo, você aprenderá sobre o módulo pyspark.sql, que fornece consultas de dados otimizadas à sua sessão do Spark.
O PySpark tem rotinas de aprendizado de máquina integradas e de ponta, além de utilitários para criar pipelines completos de aprendizado de máquina. Você aprenderá sobre eles neste capítulo.
Neste último capítulo, você aplicará o que aprendeu para criar um modelo que preveja quais voos sofrerão atrasos.