Aan de slagGa gratis aan de slag

Zet hyperlinks om naar een data frame

Bekijk de volgende ul-lijst met "handige links".

Deze bestaat uit drie li-elementen die op hun beurt a-elementen met de links bevatten:


Helpful links

Samengesteld met hulp van Google.


De bijbehorende HTML-code staat als string in hyperlink_raw_html.

In deze oefening parse je deze links naar een R data frame door alleen a-elementen te selecteren die binnen li-elementen staan.

PS: Daarvoor gebruik je tibble(), een functie uit de Tidyverse. tibble() is eigenlijk een afgeslankte versie van data.frame(), die je vast al kent. Net als bij data.frame() geef je kolomnamen en data op als paren van kolomnamen en waarden, zo:

my_tibble <- tibble(
  column_name_1 = value_1,
  column_name_2 = value_2,
  ...
)

Deze oefening maakt deel uit van de cursus

Webscraping in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>% 
  read_html() %>% 
  html_elements('li ___')
Code bewerken en uitvoeren