Selecteer meerdere HTML-typen
Zoals je in de video hebt gezien, kun je met CSS een webpagina opmaken. In de meest basale vorm gebeurt dit via type-selectors, waarbij stijlen worden gedefinieerd voor en toegepast op alle HTML-elementen van een bepaald type. Je kunt type-selectors ook gebruiken om pagina’s te scrapen op specifieke HTML-elementen.
Zoals in de video is gedemonstreerd, kun je ook meerdere type-selectors combineren met een komma, dus met html_elements("type1, type2"). Dit selecteert alle elementen die type1 of type2 hebben.
Bekijk de volgende HTML:
<html>
<body>
<div>Python is perfect for programming.</div>
<p>Still, R might be better suited for data analysis.</p>
<small>(And has prettier charts, too.)</small>
</body>
</html>
De ruwe HTML-code staat voor je klaar in de variabele languages_raw_html.
Deze oefening maakt deel uit van de cursus
Webscraping in R
Oefeninstructies
- Lees
languages_raw_htmlin. - Selecteer met de hierboven getoonde methode alle
div- énp-elementen in deze HTML.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Read in the HTML
languages_html <- ___
# Select the div and p tags and print their text
languages_html %>%
___ %>%
html_text()