Einfach am besten!
Angenommen, wir verwenden dasselbe HTML wie in der vorherigen Übung …
<html>
<body>
<div class="first section">
A text with a <a href="#">link</a>.
</div>
<div class="second section">
Some text with <a href="#">another link</a>.
<div class="first paragraph">Some text.</div>
<div class="second paragraph">Some more text.
<div>...</div>
</div>
</div>
</body>
</html>
… findest du eine Möglichkeit, genau dieselben drei Knoten wie zuvor zu selektieren – aber mit einem viel einfacheren Selektor?
Die Variable complicated_html wurde für dich vorbereitet. Sie enthält das HTML-Dokument mit dem obigen Quellcode.
Diese Übung ist Teil des Kurses
Web Scraping in R
Anleitung zur Übung
- Baue einen einfachen Selektor, der alle drei Nachfahren von
div.second.sectionauswählt. - Dieser Selektor soll genau aus zwei
div-Typselektoren und einem Leerzeichen bestehen – insgesamt sieben Zeichen!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select the three divs with a simple selector
complicated_html %>%
html_elements(___)