Zet hyperlinks om naar een data frame
Bekijk de volgende ul-lijst met "handige links".
Deze bestaat uit drie li-elementen die op hun beurt a-elementen met de links bevatten:
Helpful links
Samengesteld met hulp van Google.
De bijbehorende HTML-code staat als string in hyperlink_raw_html.
In deze oefening parse je deze links naar een R data frame door alleen a-elementen te selecteren die binnen li-elementen staan.
PS: Daarvoor gebruik je tibble(), een functie uit de Tidyverse. tibble() is eigenlijk een afgeslankte versie van data.frame(), die je vast al kent. Net als bij data.frame() geef je kolomnamen en data op als paren van kolomnamen en waarden, zo:
my_tibble <- tibble(
column_name_1 = value_1,
column_name_2 = value_2,
...
)
Deze oefening maakt deel uit van de cursus
Webscraping in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>%
read_html() %>%
html_elements('li ___')