ComenzarEmpieza gratis

La pequeña ayuda de mamá (1)

Si tu conjunto de datos tiene miles de columnas y quieres seleccionar muchas de ellas, escribir el nombre de cada columna al llamar a select() puede ser muy tedioso. Por suerte, select() tiene varias funciones auxiliares que facilitan seleccionar múltiples columnas sin escribir mucho código.

Entre estas funciones están starts_with() y ends_with(), que coinciden con columnas que empiezan o terminan con un cierto prefijo o sufijo, respectivamente. Debido a las técnicas especiales de evaluación de código de dplyr, estas funciones solo se pueden llamar dentro de una llamada a select(); por sí solas no tienen sentido.

Este ejercicio forma parte del curso

Introducción a Spark con sparklyr en R

Ver curso

Instrucciones del ejercicio

Ya tienes creada una conexión a Spark como spark_conn. También se ha predefinido un tibble asociado a los metadatos de pistas almacenados en Spark como track_metadata_tbl.

  • Selecciona todas las columnas de track_metadata_tbl que empiecen por "artist".
  • Selecciona todas las columnas de track_metadata_tbl que terminen en "id".

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

track_metadata_tbl %>%
  # Select columns starting with artist
  ___

track_metadata_tbl %>%
  # Select columns ending with id
  ___
Editar y ejecutar código