La pequeña ayuda de mamá (1)
Si tu conjunto de datos tiene miles de columnas y quieres seleccionar muchas de ellas, escribir el nombre de cada columna al llamar a select() puede ser muy tedioso. Por suerte, select() tiene varias funciones auxiliares que facilitan seleccionar múltiples columnas sin escribir mucho código.
Entre estas funciones están starts_with() y ends_with(), que coinciden con columnas que empiezan o terminan con un cierto prefijo o sufijo, respectivamente. Debido a las técnicas especiales de evaluación de código de dplyr, estas funciones solo se pueden llamar dentro de una llamada a select(); por sí solas no tienen sentido.
Este ejercicio forma parte del curso
Introducción a Spark con sparklyr en R
Instrucciones del ejercicio
Ya tienes creada una conexión a Spark como spark_conn. También se ha predefinido un tibble asociado a los metadatos de pistas almacenados en Spark como track_metadata_tbl.
- Selecciona todas las columnas de
track_metadata_tblque empiecen por"artist". - Selecciona todas las columnas de
track_metadata_tblque terminen en"id".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
track_metadata_tbl %>%
# Select columns starting with artist
___
track_metadata_tbl %>%
# Select columns ending with id
___