Analiza hipervínculos en un data frame
Echa un vistazo a la siguiente lista ul de «enlaces útiles».
Consta de tres elementos li que, a su vez, contienen elementos a con los enlaces:
Helpful links
Compiled with help from Google.
El código HTML correspondiente está disponible como cadena en hyperlink_raw_html.
En este ejercicio, vas a analizar estos enlaces y convertirlos en un data frame de R seleccionando solo los elementos a que estén dentro de elementos li.
PD: Para ello usarás tibble(), una función de Tidyverse. tibble() es básicamente una versión simplificada de data.frame(), que seguramente ya conoces. Igual que data.frame(), especificas nombres de columna y datos como pares de nombre de columna y valores, así:
my_tibble <- tibble(
column_name_1 = value_1,
column_name_2 = value_2,
...
)
Este ejercicio forma parte del curso
Web Scraping con R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>%
read_html() %>%
html_elements('li ___')