ComenzarEmpieza gratis

Unión

Otra operación de datos muy común es la unión. Las uniones son un tema aparte, así que en este curso solo veremos las uniones simples. Si quieres saber más sobre las uniones, puedes echar un vistazo aquí.

Una unión combinará dos tablas diferentes a lo largo de una columna que comparten. Esta columna se llama clave. Ejemplos de claves aquí son las columnas tailnum y carrier de la tabla flights.

Por ejemplo, supongamos que quieres saber más información sobre el avión que realizó un vuelo que solo el número de cola. Esta información no está en la tabla flights porque el mismo avión realiza muchos vuelos diferentes a lo largo de dos años, por lo que incluir esta información en cada fila daría lugar a mucha duplicación. Para evitarlo, tendrías una segunda tabla que solo tuviera una fila para cada avión y en cuyas columnas figurara toda la información sobre el avión, incluido su número de cola. Podrías llamar a esta tabla planes

Cuando unes la tabla flights a esta tabla de información sobre aviones, estás añadiendo todas las columnas de la tabla planes a la tabla flights. Para rellenar estas columnas con información, mirarás el número de cola de la tabla flights y encontrarás el que coincida en la tabla planes, y luego utilizarás esa fila para rellenar todas las columnas nuevas.

Ahora tendrás una tabla mucho más grande que antes, ¡pero ahora cada fila tiene toda la información sobre el avión que realizó ese vuelo!

¿Cuál de las siguientes opciones no es cierta?:

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Ejercicio interactivo práctico

Convierte la teoría en acción con uno de nuestros ejercicios interactivos

Empieza a hacer ejercicio