Simpelweg de beste!
Gegeven dezelfde HTML als in de vorige oefening…
<html>
<body>
<div class="first section">
A text with a <a href="#">link</a>.
</div>
<div class="second section">
Some text with <a href="#">another link</a>.
<div class="first paragraph">Some text.</div>
<div class="second paragraph">Some more text.
<div>...</div>
</div>
</div>
</body>
</html>
…kun je een manier vinden om dezelfde drie knooppunten als eerder te selecteren, maar dan met een veel eenvoudigere selector?
De variabele complicated_html is alvast voor je klaargezet. Deze bevat het HTML-document met de bovenstaande broncode.
Deze oefening maakt deel uit van de cursus
Webscraping in R
Oefeninstructies
- Maak een eenvoudige selector die alle drie de afstammelingen van
div.second.sectionselecteert. - Deze selector mag uit precies twee
div-typeselectors en een spatie bestaan, in totaal zeven tekens!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Select the three divs with a simple selector
complicated_html %>%
html_elements(___)