Uniones normales
Te han dado dos Marcos de Datos para que los combines en un único Marco de Datos útil. Tu primera tarea es combinar normalmente los DataFrames y ver el plan de ejecución.
Los DataFrames flights_df y airports_df están a tu disposición.
Este ejercicio forma parte del curso
Limpiar datos con PySpark
Instrucciones del ejercicio
- Crea un nuevo DataFrame
normal_dfuniendoflights_dfconairports_df. - Determina qué tipo de unión se utiliza en el plan de consulta.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
flights_df["Destination Airport"] == airports_df["IATA"] )
# Show the query plan
normal_df.____()