Analizza gli hyperlink in un data frame
Dai un'occhiata al seguente elenco ul di "link utili".
È composto da tre elementi li che a loro volta contengono elementi a con i link:
Helpful links
Compiled with help from Google.
Il codice HTML corrispondente è disponibile come stringa in hyperlink_raw_html.
In questo esercizio, estrarrai questi link in un data frame R selezionando solo gli elementi a che si trovano dentro gli elementi li.
PS: userai tibble(), una funzione del Tidyverse, per farlo. tibble() è sostanzialmente una versione semplificata di data.frame(), che sicuramente conosci già. Proprio come data.frame(), specifichi i nomi delle colonne e i dati come coppie di nomi di colonna e valori, in questo modo:
my_tibble <- tibble(
column_name_1 = value_1,
column_name_2 = value_2,
...
)
Questo esercizio fa parte del corso
Web scraping in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>%
read_html() %>%
html_elements('li ___')