ComenzarEmpieza gratis

Analiza hipervínculos en un data frame

Echa un vistazo a la siguiente lista ul de «enlaces útiles».

Consta de tres elementos li que, a su vez, contienen elementos a con los enlaces:


Helpful links

Compiled with help from Google.


El código HTML correspondiente está disponible como cadena en hyperlink_raw_html.

En este ejercicio, vas a analizar estos enlaces y convertirlos en un data frame de R seleccionando solo los elementos a que estén dentro de elementos li.

PD: Para ello usarás tibble(), una función de Tidyverse. tibble() es básicamente una versión simplificada de data.frame(), que seguramente ya conoces. Igual que data.frame(), especificas nombres de columna y datos como pares de nombre de columna y valores, así:

my_tibble <- tibble(
  column_name_1 = value_1,
  column_name_2 = value_2,
  ...
)

Este ejercicio forma parte del curso

Web Scraping con R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>% 
  read_html() %>% 
  html_elements('li ___')
Editar y ejecutar código