IniziaInizia gratis

Analizza gli hyperlink in un data frame

Dai un'occhiata al seguente elenco ul di "link utili".

È composto da tre elementi li che a loro volta contengono elementi a con i link:


Helpful links

Compiled with help from Google.


Il codice HTML corrispondente è disponibile come stringa in hyperlink_raw_html.

In questo esercizio, estrarrai questi link in un data frame R selezionando solo gli elementi a che si trovano dentro gli elementi li.

PS: userai tibble(), una funzione del Tidyverse, per farlo. tibble() è sostanzialmente una versione semplificata di data.frame(), che sicuramente conosci già. Proprio come data.frame(), specifichi i nomi delle colonne e i dati come coppie di nomi di colonna e valori, in questo modo:

my_tibble <- tibble(
  column_name_1 = value_1,
  column_name_2 = value_2,
  ...
)

Questo esercizio fa parte del corso

Web scraping in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>% 
  read_html() %>% 
  html_elements('li ___')
Modifica ed esegui il codice