Uniones normales
Te han dado dos Marcos de Datos para que los combines en un único Marco de Datos útil. Tu primera tarea es combinar normalmente los DataFrames y ver el plan de ejecución.
Los DataFrames flights_df
y airports_df
están a tu disposición.
Este ejercicio forma parte del curso
Limpiar datos con PySpark
Instrucciones del ejercicio
- Crea un nuevo DataFrame
normal_df
uniendoflights_df
conairports_df
. - Determina qué tipo de unión se utiliza en el plan de consulta.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Join the flights_df and aiports_df DataFrames
normal_df = flights_df.____(____, \
flights_df["Destination Airport"] == airports_df["IATA"] )
# Show the query plan
normal_df.____()