Ein Element anhand seines Textes scrapen
Wie im Video gezeigt, erlaubt dir die Funktion text() auch, Elemente (und deren Eltern) anhand ihres Textes auszuwählen. Hier ist eine geordnete Liste:
<h3>The rules of programming</h3>
<ol>
<li>Have <em>fun</em>.</li>
<li><strong>Don't</strong> repeat yourself.</li>
<li>Think <em>twice</em> when naming variables.</li>
</ol>
In dieser Übung sollst du das li-Element extrahieren, in dem „twice“ hervorgehoben ist.
Du könntest jetzt denken, dass es hier viel einfacher wäre, einen CSS-Selektor wie li:last-child zu verwenden – aber warte, bis du diese Übung beendet hast …
programming_html enthält das obige HTML-Dokument.
Diese Übung ist Teil des Kurses
Web Scraping in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select all li elements
programming_html %>%
html_elements(___ = ___)